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本 书 概述 


作为 对 《C++ Concurrency in Action》 的 中 文 翻译 。 
本 书 是 基于 C++11 新 标准 的 并 发 和 多 线程 编程 深度 指南 。 


从 std::thread、std::mutex、std::future 和 std::async 等 基础 类 的 使 用 ， 到 内 存 模 型 和 原子 操 
作 、 基 于 锁 和 无 锁 数据 结构 的 构建 ， 再 扩展 到 并 行 算 法 、 线 程 管理 ， 最 后 还 介绍 了 多 线程 代 
码 的 测试 工作 。 


本 书 的 附录 部 分 还 对 C++11 新 语言 特性 中 与 多 线程 相关 的 项 目 进行 了 简要 的 介绍 ， 并 提供 了 
C++11 线 程 库 的 完整 参考 。 


本 书 适合 于 需要 深入 了 解 C++ 多 线程 开发 的 读者 ， 以 及 使 用 C++ 进行 各 类 软件 开发 的 开发 人 


员 、 测 试 人 员 。 
对 于 使 用 第 三 方 线程 库 的 读者 ， 也 可 以 从 本 书后 面 的 章节 中 了 解 到 相关 的 指引 和 技巧 。 


同时 ， 本 书 还 可 以 作为 C++11 线 程 库 的 参考 工具 书 。 


书 与 作者 


Anthony Williams 是 BSI C++ 小 组 的 成 员 ， 拥 有 10 多 年 C++ 应 用 经 验 。 


如 今 多 核 芯 处 理 器 使 用 的 越 来 越 普遍 。C++11 标 准 支 持 多 线程 ， 这 就 需要 程序 员 掌 握 多 线程 编 
程 的 原则 、 技 术 和 新 语言 中 的 并 发 特性 ， 确 保 自己 处 于 时 代 前 沿 。 


无 论 你 的 C++ 技术 如 何 ， 本 书 都 会 指引 你 使 用 C++11 写 出 健壮 和 优雅 的 多 线程 应 用 。 本 书 将 会 
探讨 线程 的 内 存 模型 ， 新 的 多 线程 库 ， 启 动 线程 和 同步 工具 。 在 这 个 过 程 中 ， 我 们 会 了 解 并 
发 程序 中 较为 襄 手 的 一 些 问 题 。 


内 容 的 大 体 结构 : 


o C++11 编 程 


Introduction 


© 多 核 芯 编程 
。 简单 例子 用 于 学 习 ， 复 杂 例 子 用 于 实践 


本 书 是 为 C++ 程序 员 所 写 ， 同 傣 中 可 能 有 人 对 并 发 还 没什么 了 解 ， 估 计 也 有 人 已 经 使 用 其 他 语 


言 、API 或 平台 写 过 多 线程 程序 。 不 过 ， 在 看 本 书 的 时 候 ， 你 们 都 在 同一 起跑线" 上 © 


访问 本 书 论坛 曼 宁 -C++ Concurrency in Action 可 获取 免费 试 读 章节 电子 书 。 


本 书 相 关 


github 翻译 地 址 : https://github.com/xiaoweiChen/Cpp_Concurrency_In_Action 
gitbook 在 线 阅 读 : http://chenxiaowei.gitbooks.io/cpp_concurrency_in_action/ 
书 中 源码 : https://github.com/bsmr-c-cpp/Cpp-Concurrency-in-Action 

学 习 C++11/14: http://www.bogotobogo.com/cplusplus/C11 


我 与 多 线程 的 邂 把 是 在 毕业 后 的 第 一 份 工作 中 。 那 时 我 们 正在 写 一 个 填充 数据 库 的 程序 。 不 
过 ， 需 要 处 理 的 数据 量 很 大 ， 每 条 记录 都 是 独立 的 ， 并 且 需 要 在 插入 数据 库 之 前 ， 对 数据 量 
进行 合理 分 配 。 为 了 充分 利用 10 核 UltraSPARC CPU(Ultra Scalable Processor 
ARChitecture， 终 极 可 扩充 处 理 器 架构 (大 端 ))， 我 们 使 用 了 多 线程 ， 每 个 线程 处 理 自己 所 要 
记录 的 数据 。 我 们 使 用 C++ 和 POSIX 线 程 库 aie 也 犯 了 一 些 错误 当时 ， 多 线程 对 
最 后 我 们 还 是 完成 了 。 也 是 在 做 这 个 项 目的 时 候 ， 我 开 
始 注意 C++ 标准 委员 会 和 刚刚 发 布 的 C++ 标准 。 








我 对 多 线程 和 并 发 有 着 浓厚 的 兴趣 。 虽 然 ， 别 人 觉得 多 线程 和 并 发 难 用 、 复 杂 ， 还 会 让 代码 
出 现 各 种 各 样 的 问题 ， 不 过 ， 在 我 看 来 这 是 一 种 强 有 力 的 工具 ， 能 让 你 充分 使 用 硬件 资源 ， 
让 你 的 程序 运行 的 更 快 。 


从 那 以 后 ， 我 开始 使 用 多 线程 和 并 发 在 单 核 机 器 上 对 应 用 性 能 和 响应 时 间 进 行 改善 。 这 里 ， 
多 线程 可 以 帮助 你 隐藏 一 些 耗 时 的 操作 ， 比 如 IJ/O 操 作 。 同 时 ， 我 也 开始 学 习 在 操作 系统 级 别 
上 使 用 多 线程 ， 并 且 了 解 Intel CPU 如 何 处 理 任务 切换 。 


同时 ， 对 C++ 的 兴趣 让 我 与 ACCU 有 了 联系 ， 之 后 是 BSI( 英 国标 准 委员 会 ) 中 的 C++ 标准 委员 
会 ， 还 有 Boost。 也 是 因为 兴趣 的 原因 ， 我 参与 了 Boost 线 程 库 的 初期 开发 工作 ， 虽 然 初 期 版 
本 已 经 被 开发 者 们 放弃 ， 但 是 我 抓 住 了 这 次 机 会 。 直 到 现在 ， 我 依然 是 Boost 线 程 库 的 主要 开 
发 者 和 维护 者 。 


作为 C++ 标准 委员 会 的 一 员 ， 对 现 有 标准 的 缺陷 的 和 不 足 进 行 改善 ， 并 为 新 标准 提出 建议 (新 
标准 命名 为 C++0Xx 是 希望 它 能 在 2009 年 发 布 ， 不 过 最 后 因为 2011 年 才 发 布 ， 所 以 官方 命名 为 
C++11)。 我 也 参与 很 多 BSI 的 工作 ， 并 且 我 也 为 自己 的 建议 起 草 建议 书 。 当 委员 会 将 多 线程 提 
上 C++ 标 准 的 日 程 时 ， 我 高 兴 得 差点 飞 起 来 ， 因 为 我 起 草 及 合 著 的 多 线程 和 并 发 相关 的 草案 ， 
将 会 成 为 新 标准 的 一 部 分 。 新 标准 将 我 (计算 机 相关 ) 的 两 大 兴趣 爱好 一 一 C++ 和 多 线程 一 一 结 
合 起 来 ， 想 想 还 还 有 点 小 激动 。 





本 书 旨 在 教会 其 他 C++ 开发 者 如 何 安全 、 高 效 地 使 用 C++11 线 程 库 。 我 对 C++ 和 多 线程 的 热 
爱 ， 希 望 你 也 能 感受 得 到 。 


封面 图 片 介 绍 


本 书 的 封面 图 片 的 标题 是 “日 本 女性 的 着 装 ”(Habit of a Lady of Japan)。 这 张 图 源 自 Thomas 
Jefferys 所 羞 的 《不 同 民 族 服 饰 的 收藏 》(Collection of the Dress of Different Nations)[1] 第 四 
卷 (大 概 在 1757 年 到 1772 年 间 出 版 )。Thomas 收 集 的 服饰 包罗 万 象 ， 他 的 绘画 优美 而 又 细腻 ， 
对 欧洲 戏剧 服装 设计 产生 了 长 达 200 多 年 的 影响 。 服 饰 中 包含 着 一 个 文明 的 过 去 和 现在 ， 不 同 
时 代 中 各 个 国家 的 习俗 通过 不 同 的 服饰 棚 棚 如 生地 呈现 在 伦敦 剧院 的 观众 面前 。 


从 上 个 世纪 以 来 ， 着 装 风 格 已 经 发 生 了 很 多 变化 ， 各 个 国家 和 区 域 之 间 巨 大 的 差异 逐渐 消 
失 。 现 在 已 经 很 难 分 辨 出 不 同 洲 不 同 地 区 的 人 们 的 着 装 差异 。 或 许 ， 我 们 放弃 了 这 种 文化 上 
的 差异 ， 得 到 的 却 是 更 加 丰富 多 彩 的 个 人 生活 或 者 说 是 一 种 更 加 多 样 有 趣 、 更 快 节奏 的 
科技 生活 。 





在 各 种 计算 机 图 书 铺天盖地 、 让 人 难以 分 辨 的 时 代 ，Manning 出 版 社 正 是 为 了 赞美 计算 机 行业 
中 的 创新 性 和 开拓 性 ， 才 选用 了 这 个 重 现 两 个 世纪 之 前 丰富 多 样 的 地 域 风情 的 图 片 。 


【1】 《iPhone 与 ijPad 开 发 实战 》 使 用 了 书 中 的 另 一 张 图 片 ， 感 兴趣 的 同学 可 以 去 图 灵 社 区 
进行 试 读 ( 只 免费 提供 第 1 章 内 容 )， 本 章 翻 译 复制 了 这 本 书 翻 译 的 部 分 内 容 


关于 这 本 书 


本 书 是 并 发 和 多 线程 机 制 指 导 书 籍 ( 基 于 C++11 标 准 ) 。 从 最 基本 的 std::thread 
std::mutex 和 std: async 的 使 用 ， 到 复杂 的 原子 操作 和 内 存 模型 


路 线 图 


前 4 章 ， 介 绍 了 标准 库 提 供 的 各 种 库 工 具 ， 展 示 了 使 用 方法 。 


第 5 章 ， 涵 盖 了 底层 内 存 模型 和 原子 操作 的 实际 情况 ， 包 括 原子 操作 如 何 对 执行 顺序 进行 限制 
这 章 标 志 着 介绍 部 分 的 结束 ) 。 


一 





第 6、7 章 ， 开 始 讨论 高 级 主题 ， 如 何 使 用 基本 工具 去 构建 复杂 鲜 
的 数据 结构 ， 第 7 章 是 无 锁 数据 结构 。 





第 6 章 是 基于 锁 


第 8 章 ， 对 设计 多 线程 代码 给 了 一 些 指 导 意见 ， 履 盖 了 性 能 问题 和 并 行 算法 








HOR AE 线程 池 ， 工 作 队列 和 中 断 操作 。 


第 10 章 ， 测 试 和 调试 一 Bug 类 型 ， 定 位 Bug 的 技巧 ， 以 及 如 何 进行 测试 等 等 。 





附录 ， 包 括 新 的 语言 特性 的 简要 描述 ， 主 要 是 与 多 线程 相关 的 特性 ， 以 及 在 第 4 章 中 提 到 的 消 
息 传 递 库 的 实现 细节 和 C++11 线 程 库 的 完整 的 参考 。 


谁 应 该 读 这 本 书 


如 果 你 正在 用 C++ 写 一 个 多 线程 程序 ， 你 应 该 阅读 本 书 。 如 果 你 正在 使 用 C++ 标 准 库 中 新 的 多 
线程 工具 ， 你 可 以 从 本 书 中 得 到 一 些 指 导 意 见 。 如 果 你 正在 使 用 其 他 线程 库 ， 后 面 章节 里 的 
建议 和 技术 指导 也 很 值得 一 看 。 


阅读 本 书 需 要 你 有 较 好 的 C++ 基础 ; 虽然 ， 关 于 多 线程 编程 的 知识 或 者 经 验 不 是 必须 的 ， 不 过 
这 些 经 验 可 能 有 用 。 
如 何 使 用 这 本 书 


如 果 从 来 没有 写 过 多 线程 代码 ， 我 建议 你 从 头 到 尾 阅读 本 书 ; 不 过 ， 可 以 跳 过 第 5 章 中 的 较为 
细节 的 部 分 。 第 7 i a a 
章 时 ， 已 经 读 过 第 5 章 。 


如 果 没 有 用 过 C++11 的 工具 ， 为 AEn ， 可 以 先 阅读 一 下 附录 。 新 工具 的 使 用 在 
文本 中 已 经 标注 出 来 ， 不 过 ， 当 遇 到 一 些 没 见 过 的 工具 时 ， 可 以 随时 回 看 附录 。 


即使 有 不 同 环境 下 写 多 线程 代码 的 经 验 ， 开 始 的 章节 仍 有 必要 浏览 一 下 ， 这 样 就 能 清楚 地 知 
道 ， 你 所 熟知 的 工具 在 新 的 C++ 标准 中 对 应 了 哪些 工具 。 如 果 使 用 原子 变量 去 做 一 些 底层 工 
作 ， 第 5 章 必 须 阅读 。 第 8 章 ， 有 关 C++ 多 线程 的 异常 和 安全 性 的 内 容 很 值得 一 看 。 如 果 你 对 
某 些 关键 词 比较 感 兴趣 ， 索 引 和 目录 能 够 帮 你 快速 找到 相关 的 内 容 。 


你 可 能 喜欢 回顾 主要 的 章节 ， 并 用 自己 的 方式 阅读 示例 代码 。 虽 然 你 已 经 了 解 C++ 线程 库 ， 但 
附录 D 还 是 很 有 有 用。 例如， 查找 每 个 类 和 函数 的 细节 。 


代码 公约 和 下 载 


为 了 区 分 普通 文本 ， 清 单 和 正文 中 的 中 的 所 有 代码 都 采用 像 这 样 的 固定 宽度 的 字体 。 许 多 清单 都 
伴随 着 代码 注释 ， 突 出 显示 重要 的 概念 。 在 某 些 情况 下 ， 你 可 以 通过 页 下 给 出 的 快捷 链接 进 
行 查阅 。 


本 书 所 有 实例 的 源 代 码 ， 可 在 出 版 商 的 网 站 上 进行 下 载 : 
www.manning.com/cplusplusconcurrencyinaction ° 


软件 需求 


使 用 书 中 的 代码 ， 可 能 需要 一 个 较 新 的 C++ 编译 器 (要 支持 C++11 语 言 的 特性 ( 见 附录 A))， 还 需 
要 C++ 支持 标准 线程 库 。 


写本 书 的 时 候 ，g++ 是 唯一 实现 标准 线程 库 的 编译 器 (尽管 Microsoft Visual Studio 2011 

preview 中 也 有 实现 )。g++4.3 发 布 时 添加 了 线程 库 ， 并 且 在 随后 的 发 布 版 本 中 进行 扩展 。 

gha 3 也 支持 部 分 C++11 语 言 特 性 ， 更 多 特性 的 支持 在 后 续 发 布 版 本 中 也 有 添加 。 更 多 细节 
请 参考 g++ C++11 的 状态 页 面 [1] 。 


Microsoft Visual Studio 2010 支 持 部 分 C++11 特 性 ， 例 如 : 右 值 引用 和 |lambda 部 数 ， 但 是 没有 
实现 线程 库 。 


我 的 公司 Software Solutions Ltd， 销 售 C++11 标 准 线 程 库 的 完整 实现 ， 其 可 以 使 用 在 
Microsoft Visual Studio 2005, Microsoft Visual Studio 2008, Microsoft Visual Studio 2010 ° 
以 及 各 种 g++ 版 本 上 [2]。 这 个 线程 库 也 可 以 用 来 测试 本 书 中 的 例子 


Boost 线 程 库 [3] 提 供 的 API1， 以 及 可 移植 到 多 个 平台 。 本 书 中 的 大 多 数 例子 将 std:: 替换 
为 boost:: > Æ #include 引用 适当 的 头 文件 ， 就 能 使 用 Boost 线 程 库 来 运行 。 还 有 部 分 工具 
还 不 支持 (例如 std::async ) 或 在 Boost 线 程 库 中 有 着 不 同名 字 ( 例 


如 : boost: :unique_future ) ° 


作者 在 线 


购买 C++ Concurrency in Action 就 能 访问 曼 宁 (Manning Publications) 的 私人 网 络 论坛 ， 在 那 
里 可 以 对 本 书 做 一 些 评论 ， 问 一 些 技术 问题 ， 获 得 作者 或 其 他 读者 的 帮助 。 为 了 能 够 访问 论 
坛 和 订阅 它 的 内 容 ， 在 浏览 器 地 址 中 输入 www.manning.com/CPIusPlusConcurrencyinAction 
后 ， 页 面 将 告诉 你 如 何 注 册 之 后 访问 论坛 ， 你 能 获得 什么 样 的 帮助 ， 还 有 论坛 中 的 一 些 规 

H] o 


曼 宁 保证 为 本 书 的 读者 提供 互相 交流 ， 以 及 和 作者 交流 的 场所 。 虽 然 曼 宁 自 愿 维护 本 书 的 论 
坛 ， 但 不 保证 这 样 的 场所 不 会 收取 任何 的 费用 。 所 以 ， 建 议 你 可 以 尝试 提 一 些 有 挑战 性 的 问 
题 给 作者 ， 免 得 这 样 的 地 方 白白 浪费 。 


在 本 书 印 刷 时 ， 就 可 以 通过 |nternet 访 问 作 者 的 在 线 论坛 和 之 前 讨论 的 文字 记录 。 


【1】GNU Compiler Collection C++0x/C++11 status page， 
http://gcc.gnu.org/projects/cxx0x.html. 


【2】The just::thread implementation of the C++ Standard Thread Library, 
http://www.stdthread.co.uk. 


(3] The Boost C++ library collection, http://www.boost.org. 


BAS 你 好 ，C++ 的 并 发 世界 ! 


本 章 主要 内 容 


。 何谓 并 发 和 多 线程 

© 应 用 程序 为 什么 要 使 用 并 发 和 多 线程 
o C++ 的 并 发 史 

。 一 个 简单 的 C++ 多 线程 程序 


令 C++ 用 户 振奋 的 时 刻 到 了 。 距 初始 的 C++ 标准 (1998 年 ) 发 布 13 年 后 ，C++ 标 准 
语言 本 身 ， 以 及 标准 库 ， 带 来 了 一 次 重大 的 变革 。 


yh 
=n 
"> 
$ 
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新 C++ 标准 (也 被 称 为 C++11 或 C++0X) 在 2011 年 发 布 ， 带 来 一 系列 的 变革 让 C++ 编程 更 加 简 
单 和 高 效 。 


其 中 一 个 最 重要 的 新 特性 就 是 对 多 线程 的 支持 。 


C++ 标准 第 一 次 承认 多 线程 在 语言 中 的 存在 ， 并 在 标准 库 中 为 多 线程 提供 组 件 。 这 意味 着 使 用 
C++ 编写 与 平台 无 关 的 多 线程 程序 成 为 可 能 ， 也 为 可 移植 性 提供 了 强 有 力 的 保证 。 与 此 同时 ， 
程序 员 们 为 提高 应 用 的 性 能 ， 对 并 发 的 关注 也 是 与 日 俱 增 ， 特 别 在 多 线程 编程 方面 。 


本 书 是 介绍 如 何 使 用 C++11 多 线程 来 编写 并 发 程序 ， 及 相关 的 语言 特性 和 库 工具 (library 
facilities)。 本 书 以 “解释 并 发 和 多 线程 的 含义 ， 为 什么 要 使 用 并 发 ”作为 起 始点 ， 在 对 “什么 情况 
下 不 使 用 并 发 "进行 阔 述 之 后 ， 将 对 C++ 支 持 的 并 发 方式 进行 概述 ; 最 后 ， 以 一 个 简单 的 
C++ 并 发 实例 结束 这 一 章 。 资 深 的 多 线程 开发 人 员 可 以 跳 过 前 面 的 小 节 。 在 后 面 的 几 个 章节 
中 ， 会 有 更 多 的 例子 ， 以 便 大 家 对 库 工 具 进 行 更 加 深入 的 了 解 。 本 书 最 后 ， 将 会 给 出 所 有 多 
线程 与 并 发 相关 的 C++ 标准 库 工 具 的 全 面 参考 。 


问题 来 了 ， 何 谓 并 发 ?何谓 多 线程 ? 


1.1 何谓 并 发 


最 简单 和 最 基本 的 并 发 ,是 指 两 个 或 更 多 独立 的 活动 同时 发 生 。 


并 发 在 生活 中 随处 可 见 ， 我 们 可 以 一 边 走 路 一 边 说 话 ， 也 可 以 两 只 手 同 时 作 不 同 的 动作 ， 还 
有 我 们 每 个 人 都 过 着 相互 独立 的 生活 当 我 在 游泳 的 时 候 ， 你 可 以 看 球赛 ， 等 等 。 





1.1.1 计算 机 系统 中 的 并 发 


计算 机 领域 的 并 发 指 的 是 在 单个 系统 里 同时 执行 多 个 独立 的 任务 ， 而 非 顺序 的 进行 一 些 活 
动 。 


计算 机 领域 里 ， 人 很 多 年 前 ， 一 台 计 算 机 就 能 通过 多 任务 操作 系统 的 切 





eee 云 行 多 个 应 用 程序 ; 高 端 多 处 理 器 服务 器 人 
。 那 “ 老 东 西 " 上 有 哪些 “新 东西 "能 让 on 计算 机 领域 越 来 越 流 行 呢 ? 
a 种 错 4 觉 Q 


以 前 ， 大 多 数 计 算 机 只 有 一 个 处 理 器 ， 具 有 单个 处 理 单 元 (processing unit) 或 核心 (core), 如 今 
还 有 很 多 这 样 的 台式 机 。 这 种 机 器 只 能 在 某 一 时 刻 执行 一 个 任务 ， 不 过 它 可 以 每 秒 进行 多 次 
任务 切换 。 通 过 “这 个 任务 做 一 会 ， 再 切换 到 别 的 任务 ， 再 做 一 会 儿 ? 的 方式 ， 让 任务 看 起 来 是 
并 行 执行 的 。 这 种 方式 称 为 任务 切换 。 如 今 , 我 们 仍然 将 这 样 的 系统 称 为 并 发 :因为 任务 切换 得 
太 快 ， 以 至 于 无 法 感觉 se ea ages 时 挂 起 ， 而 切换 到 另 一 个 任务 。 任 务 切 换 会 给 用 
户 和 应 用 程序 造成 一 种 “并 发 的 假象 ”。 这 种 假象 ， 当 应 用 在 任务 切换 的 环境 下 和 丨 正 并 发 
环境 下 执行 相 比 ， 行 为 还 是 有 着 微妙 同 。 特 别 是 对 内 存 模 型 不 正确 的 假设 ( 详 见 第 5 章 ), 在 
多 线程 环境 中 可 能 不 会 出 现 ( 详 见 第 10 章 ) 。 


多 处 理 器 计算 机 用 于 服务 器 和 高 性 外 Et ORT 。 基 于 een a aes 
机 ， 也 越 来 越 大 众 化 。 无 论 拥 有 几 个 处 理 器 ， 这 些 机 器 都 能 够 痢 正 的 并 行 多 个 任务 。 我 们 称 
其 为 硬件 并 发 (hardware concurrency)” ° 


图 1.1 显 示 了 一 个 计算 机 处 理 恰 好 两 个 任务 时 的 理想 情景 ， 每 个 任务 被 分 为 10 个 相等 大 小 的 
块 。 ey er s( 具 有 两 个 处 理 核心 ) 上 UE e R T ain a 
机 器 上 做 任务 切换 时 ， 每 个 任务 的 块 交 织 进 行 。 但 它们 中 间 有 一 小 段 分 隔 ( 图 中 所 示 灰 色 分 隔 
条 的 厚度 大 于 双核 机 器 的 分 隔 条 ); 为 了 实现 交 Ce E ee ee cyan 
需要 切换 一 次 上 下 文 (context switch)， 任 务 切 换 也 有 时 间 开 销 。 进 行 上 下 文 的 切换 时 ， 操 作 
系统 必须 为 当前 运行 的 任务 保存 CPU 的 状态 和 指令 指针 ， 并 计算 出 要 切换 到 哪个 任务 ， 并 为 
即将 切换 到 的 任务 重新 加 载 处 理 器 状态 。 然 后 ，CPU 可 能 要 将 新 任务 的 指令 和 数据 的 内 存 载 
入 到 缓存 中 ， 这 会 阻止 CPU 执行 任何 指令 ， 从 而 造成 的 更 多 的 延迟 。 





图 1.1 并 发 的 两 种 方式 : MAS HY A EHT Vs. 单 核 机 器 的 任务 切换 


ee 可 以 在 一 个 核心 上 执行 多 个 线程 ,但 硬件 并 发 在 多 处 理 器 或 多 核 系 统 上 效果 更 加 显 
硬件 线程 最 重要 的 因素 是 数量 ,也 就 是 硬件 上 可 以 并 发 运行 多 少 独立 的 任务 。 即 便 是 具有 
ax 硬件 并 发 的 系统 ， 也 很 容易 拥有 比 硬件 “可 并 行 最 大 任务 数 " 还 要 多 的 任务 需要 执行 ， 所 以 
任务 切换 在 这 些 情 况 下 仍然 适用 。 例 如 ， 和 
任务 在 运行 ， 即 便 是 在 计算 机 处 于 空闲 时 ， 还 是 会 有 后 台 任 务 在 运行 。 正 是 任务 切换 使 得 这 
些 后 台 任务 可 以 运行 ， 并 使 得 你 可 以 同时 运行 文字 处 理 器 、 编 译 器 、 编 辑 器 和 web 浏 览 器 (或 
其 他 应 用 的 组 合 )。 图 1.2 显 示 了 四 个 任务 在 双核 处 理 器 上 的 任务 切换 ， 仍 然 是 将 任务 整齐 地 划 
rere 实际 上 ， 许 多 因素 会 使 得 分 割 不 均 和 调度 不 规则 。 部 分 因素 将 
在 第 8 章 中 讨论 ， 那 时 我 们 再 来 看 一 看 影响 并 行 代码 性 能 的 因素 。 


ss 


无 论 应 用 程序 在 单 核 处 理 器 ， 还 是 多 核 处 理 器 上 运行 ; 也 不 论 是 任务 切换 还 是 卜 正 的 硬件 并 
发 ， 这 里 提 到 的 技术 、 功 能 和 类 (本 书 所 涉及 的 ) 都 能 使 用 得 到 。 如 何 使 用 并 发 ， 将 很 大 程度 上 
取决 于 可 用 的 硬件 并 发 。 我 们 将 在 第 8 章 中 再 次 讨论 这 个 问题 ， 并 具体 研究 C++ 代码 并 行 设 计 
的 问题 。 





图 1.2 四 个 任务 在 两 个 核心 之 间 的 切换 


1.1.2 并 发 的 途径 


试想 当 两 个 程序 员 在 两 个 独立 的 办 公 室 一 起 做 一 个 软件 项 目 ， 他 们 可 以 安静 地 工作 、 不 互相 
干扰 ， 并 且 他 们 人 手 一 套 和 参考 手册 。 但 是 ， 他 们 沟通 起 来 就 有 些 困 难 ， 上 比 起 可 以 直接 互相 交 
谈 ， 他 们 必须 使 用 电话 、 inci Alla | 对方 的 办 公 室 进行 直接 交流 。 并 且 ， 管 理 两 个 办 公 室 
需要 有 一 定 的 经 费 支 出 ， 还 需要 购买 多 份 参 考 手 册 。 


假设 ， 让 开发 人 员 同 在 一 间 办 公 室 办 公 ， 他 们 可 以 自由 的 对 某 个 应 用 程序 设计 进行 讨论 ， 也 
可 以 在 纸 或 白板 上 轻易 的 绘制 图 表 ， 对 设计 观点 进行 辅助 性 冰释 。 现 在 ， 你 只 需要 管理 一 个 
办 公 室 ， 只 要 有 一 套 参考 资料 就 够 了 。 遗 憾 的 是 ， 开 发 人 员 可 能 难以 集中 注意 力 ， 并 且 还 可 
能 存在 资源 共享 的 问题 (比如 ，“ 参 考 手册 哪 去 了 ?”) 


以 上 两 种 方法 ， 描 绘 了 并 发 的 两 种 基本 途径 。 每 个 开发 人 员 代 表 一 个 线程 ， 每 个 办 公 室 代表 
一 个 进程 。 第 一 种 途径 是 每 个 进程 只 要 一 个 线程 ， 这 就 类 似 让 每 个 开发 人 员 拥 有 自己 的 办 公 
室 ， 而 第 二 种 途径 是 每 个 进程 有 多 个 线程 ， 如 同一 个 办 公 室 里 有 两 个 开发 人 员 。 让 我 们 在 一 
个 应 用 程序 中 简单 的 分 析 一 下 这 两 种 途径 。 


多 进程 并 发 


使 用 并 发 的 第 一 种 方法 ， 是 将 应 用 程序 分 为 多 个 独立 的 进程 ， 它 们 在 同一 时 刻 运 行 ， 就 像 同 
时 进行 网 页 浏览 和 文字 处 理 一 样 。 le as ， 独立 的 进程 可 以 通过 进程 间 常 规 的 通信 渠道 


传递 讯息 (信号 、 套 接 字 、 文 件 、 管 道 等 等 )。 不 过 ， 这 种 进程 之 间 的 通信 通常 不 是 设置 复杂 ， 
就 是 速度 慢 ， 这 是 因为 操作 系统 会 在 进 ae 了 一 定 的 保护 措施 ， 以 避免 一 个 进程 去 修改 
另 一 个 进程 的 数据 。 还 有 一 个 缺点 是 ， 运 行 多 个 进程 所 需 的 国定 开销 : 需要 时 间 启 动 进 程 ， 


操作 系统 需要 内 部 资源 来 管理 进程 ， 等 等 。 


当然 ， 以 上 的 机 制 也 不 < : 操作 系统 在 进程 间 提 供 附加 的 保护 操作 和 更 高 级 别 的 通 
信 机 制 ， 意 味 着 可 以 更 容易 编写 安全 的 并 发 代码 。 实 际 上 ， 在 类 似 于 Erlang 的 编程 环境 中 ， 将 
进程 作为 并 发 的 基本 构造 块 。 


使 用 多 进程 实现 并 发 还 有 一 个 额外 的 优势 可 以 使 用 远程 连接 (可 能 需要 联网 ) 的 方式 ， 在 
不 同 的 机 器 上 运行 独立 的 进程 o 虽然 ’ 这 增加 了 1 通信 成 本 ， ， 但 在 设计 精 良 的 系统 上 这 可 能 
是 一 个 提高 并 行 可 用 行 和 性 能 的 低 成 本 方式 。 













ay 


图 1.3 一 对 并 发 运行 的 进程 之 间 的 通信 
多 线程 并 发 

并 发 的 另 一 个 途径 ， 在 单个 进程 中 运行 多 个 线程 。 线 程 很 像 轻 量 级 的 进程 : 每 个 线程 相互 独 
立 运行 ， 且 线程 可 以 在 不 同 的 指令 序列 中 和 运行。 但 是 ， 进 程 中 的 所 有 线程 都 共享 地 址 空间 ， 
并 且 所 有 线程 访问 到 大 部 分 数据 全 局 变量 仍然 是 全 局 的 ， 指 针 、 对 象 的 引用 或 数据 可 
以 在 线程 之 间 人 传递。 虽然 ， 进 程 之 间 通 常 共享 内 存 ， 但 是 这 种 共享 通常 是 难以 建立 和 管理 


的 。 因 为 ， 同 一 数据 的 内 存 地 址 在 不 同 的 进程 中 是 不 相同 。 图 1.4 展 示 了 一 个 进程 中 的 两 个 线 
程 通过 共享 内 存 进 行 通信 。 








图 1.4 同一 进程 中 的 一 对 并 发 运行 的 线程 之 间 的 通信 


地 址 空间 共享 ， 以 及 缺少 线程 间 数 据 的 保护 ， 使 得 操作 系统 的 记录 工作 量 减 小 ， 所 以 使 用 多 
线程 相关 的 开销 远 远 小 于 使 用 多 个 进程 。 不 过 ， 共 享 内 存 的 灵活 性 是 有 代价 的 : 如 果 数 据 要 
被 多 个 线程 访问 ， 那 么 程序 员 必 须 确保 每 个 线程 所 访问 到 的 数据 是 一 致 的 (在 本 书 第 3、4、5 
和 8 章 中 会 涉及 ， 线 程 间 数据 共享 可 能 会 遇 到 的 问题 ， 以 及 如 何 使 用 工具 来 避免 这 些 问 题 )。 问 
题 并 非 无 解 ， 只 要 在 编写 代码 时 适当 地 注意 即 可 ， 这 同样 也 意味 着 需要 对 线程 通信 做 大 量 的 
工作 。 


多 个 单线 程 /进程 间 的 通信 (包含 启动 ) 要 比 单一 进程 中 的 多 线程 间 的 通信 (包括 启动 ) 的 开销 大 ， 
若 不 考虑 共享 内 存 可 能 会 带 来 的 问题 ， 多 线程 将 会 成 为 主流 语言 (包括 cH ) 更 青睐 的 并 发 途 
径 。 此 外 ， c++ 标准 并 未 对 进程 间 通信 提供 任何 原生 支持 ， 所 以 使 用 多 进程 的 方式 实现 ， 这 
会 依赖 与 平台 相关 的 API。 因 此 ， 本 书 只 关注 使 用 多 线程 的 并 发 ， 并 且 在 此 之 后 所 提 到 “并 
发 "， 均 假设 为 多 线程 来 实现 。 


了 解 并 发 后 ， 让 来 看 看 为 什么 要 使 用 并 发 。 


1.2 为 什么 使 用 并 发 ? 


主要 原因 有 两 个 : 关注 点 分 离 (SOC) 和 性 能 。 事 实 上 ， 它 们 应 该 是 使 用 并 发 的 唯一 原因 ; 如 果 
你 观察 得 足够 仔细 ， 所 有 因素 都 可 以 归结 到 其 中 的 一 个 原因 (或 者 可 能 是 两 个 都 有 。 当 然 ， 除 
了 像 "就 因为 我 愿意 "这 样 的 原因 之 外 ) 。 


1.2.1 为 了 分 离 关 注 点 


编写 软件 时 ， 分 离 关 注 点 是 个 好 主意 ; 通过 将 相关 的 代码 与 无 关 的 代码 分 离 ， 可 以 使 程序 更 

容易 理解 和 测试 ， 从 而 减少 出 错 的 可 能 性 。 即 使 一 些 功 能 区 域 中 的 操作 需要 在 同一 时 刻 发 生 
的 情况 下 ， 依 昌 可 以 使 用 并 发 分 离 不 同 的 功能 区 域 ; 若 不 显 式 地 使 用 并 发 ， 就 得 编写 一 个 任 
务 切换 框架 ， 或 者 在 操作 中 主动 地 调用 一 段 不 相关 的 代码 。 


考虑 一 个 有 用 户 界面 的 处 理 密集 型 应 用 一 一 DVD 播 放 程序 。 这 样 的 应 用 程序 ， 应 具备 这 两 种 
功能 : 一 ， 要 从 光盘 中 读 出 数据 ， 对 图 像 和 声音 进行 解码 ， 之 后 把 解码 出 的 信号 输出 至 视频 
和 音频 硬件 ， 从 而 实现 DVD 的 无 误 播放 ; 二 ， 还 需要 接受 来 自用 户 的 输入 ， 当 用 户 单 击 “ 暂 
停 *、“ 返 回 菜单 "或 “退出 "按键 的 时 候 执行 对 应 的 操作 。 当 应 用 是 单个 线程 时 ， 应 用 需要 在 回放 
期 间 定 期 检查 用 户 的 输入 ， 这 就 需要 把 "DVD 播放 ”代码 和 “用 户 界 面 "代码 放 在 一 起 ， 以 便 调 
用 。 如 果 使 用 多 线程 方式 来 分 隔 这 些 关注 点 ，“ 用 户 界面 "代码 和 "DVD 播放 ”代码 就 不 再 需要 放 
在 一 起 : 一 个 线程 可 以 处 理 " 用 户 界 面 " 事 件 ， 另 一 个 进行 “DVD 播放 ”。 它 们 之 间 会 有 交互 (用 户 
点 击 “暂停 ， 不 过 任务 间 需 要 人 为 的 进行 关联 。 


fee ORE a PE th ye 

给 忙 太 线程， 这 时 的 相应 可 以 是 简单 地 显示 代表 忙 厌 的 光标 或 "请 等 待 " 字 样 的 消息 。 类 似 
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文件 系统 变化 的 任务 。 因 为 它们 之 间 的 交互 清晰 可 辩 ， 所 以 这 种 方式 会 使 每 个 线程 的 逻辑 变 
的 更 加 简单 。 


在 这 种 情况 下 ， 线 程 的 数量 不 再 依赖 CPU 中 的 可 用 内 核 的 数量 ， 因 为 对 线程 的 划分 是 基于 概 
念 上 的 设计 ， 而 不 是 一 种 增加 吞吐 量 的 尝试 。 


1.2.2 为 了 性 能 


多 处 理 器 系统 已 经 存在 了 几 十 年 ， 但 直到 最 近 ， 它 们 也 只 在 超级 计算 机 、 大 型 机 和 大 型 服务 
器 系统 中 才能 看 到 。 然 而 ， 芯 片 制 造 商 越 来 越 倾 向 于 多 核 芯片 的 设计 ， 即 在 单个 芯片 上 集成 
2、4、16 或 更 多 的 处 理 器 ， 从 而 获取 更 好 的 性 能 。 因 此 ， 多 核 台 式 计 算 机 、 多 核 谨 入 式 设 
备 ， 现 在 越 来 越 普遍 。 它 们 计算 能 力 的 提高 不 是 源 自 使 单一 任务 运行 的 更 快 ， 而 是 并 行 运行 
多 个 任务 。 在 过 去 ， 程 序 员 曾 坐 看 他 们 的 程序 随 着 处 理 器 的 更 新 换代 而 变 得 更 快 ， 无 需 他 们 


这 边 做 任何 事 。 但 是 现在 ， 就 像 Herb Sutter 所 说 的 ，“ 没 有 免费 的 午餐 了 。”[1] 如 果 想 要 利用 
日 益 增 长 的 计算 能 力 ， 那 就 必须 设计 多 任务 并 发 式 软 件 。 程 序 员 必须 留意 这 个 ， 尤 其 是 那些 
迄今 都 忽略 并 发 的 人 们 ， 现 在 很 有 必要 将 其 加 入 工具 箱 中 了 。 


两 种 方式 利用 并 发 提高 性 能 : 第 一 ， 将 一 个 单个 任务 分 成 几 部 分 ， 且 各 自 并 行 运行 ， 从 而 降 
低 总 运行 时 间 。 这 就 是 任务 并 行 (task parallelism) 。 虽 然 这 听 起 来 很 直观 ， 但 它 是 一 个 相当 
复杂 的 过 程 ， 因 为 在 各 个 部 分 之 间 可 能 存在 着 依赖 。 区 别 可 能 是 在 过 程 方 面 一 ”一 个 线程 执 
行 算法 的 一 部 分 ， 而 另 一 个 线程 执行 算法 的 另 一 个 部 分 一 “或 是 在 数据 方面 一 每 个 线程 在 
不 同 的 数据 部 分 上 执行 相同 的 操作 (第 二 种 方式 ) 。 后 一 种 方法 被 称 为 数据 并 行 (data 
parallelism) 。 


第 一 种 并 行 方式 影响 的 算法 常 被 称 为 易 并 行 (emmbarrassingjy parajlej) 算 法 。 尽 管 易 并 行 算法 
的 代码 会 让 你 感觉 到 头痛 ， 但 这 对 于 你 来 说 是 一 件 好 事 : 我 曾 遇 到 过 自然 并 行 (naturaly 
parallel)#24& 4! # £ (conveniently concurrent) 的 算法 。 吻 并 行 算法 具有 良好 的 可 扩展 特性 一 一 
当 可 用 硬件 线程 的 数量 增加 时 ， 算 法 的 并 行 性 也 会 随 之 增加 。 这 种 算法 能 很 好 的 体现 人 多 力 
量 大 。 如 果 算 法 中 有 不 易 并 行 的 部 分 ， 你 可 以 把 算法 划分 成 国定 (不 可 扩展 ) 数 量 的 并 行 任务 。 
第 8 章 将 会 再 来 讨论 ， 在 线程 之 间 划 分 任务 的 技巧 。 


第 二 种 方法 是 使 用 可 并 行 的 方式 ， 来 解决 更 大 的 问题 ; 与 其 同时 处 理 一 个 文件 ， 不 如 酌情 处 
理 2 个 、10 个 或 20 人 个。 虽然 ， 这 是 数据 并 行 的 一 种 应 用 (通过 对 多 组 数据 同时 执行 相同 的 操 
作 )， 但 着 重点 不 同 。 处 理 一 个 数据 块 仍 然 需要 同样 的 时 间 ， 但 在 相同 的 时 间 内 处 理 了 更 多 的 
数据 。 当 然 ， 这 种 方法 也 有 限制 ， 并 非 在 所 有 情况 下 都 是 有 益 的 。 不 过 ， 这 种 方法 所 带 来 的 
吞吐 量 提升 ， 可 以 让 某 些 新 功能 成 为 可 能 ， 例 如 ， 可 以 并 行 处 理 图 片 的 各 部 分 ， 就 能 提高 视 
频 的 分 辨 率 。 


1.2.3 什么 时 候 不 使 用 并 发 


知道 何 时 不 使 用 并 发 与 知道 何 时 使 用 它 一 样 重要 。 基 本 上 ， 不 使 用 并 发 的 唯一 原因 就 是 ， 收 
益 比 不 上 成 本 。 使 用 并 发 的 代码 在 很 多 情况 下 难以 理解 ， 因 此 编写 和 维护 的 多 线程 代码 就 会 
产生 直接 的 脑力 成 本 ， 同 时 额外 的 复杂 性 也 可 能 引起 更 多 的 错误 。 除 非 潜 在 的 性 能 增益 足够 
大 或 关注 点 分 离 地 足够 清晰 ， 能 抵消 所 需 的 额外 的 开发 时 间 以 及 与 维护 多 线程 代码 相关 的 额 
外 成 本 (代码 正确 的 前 提 下 ) ; 否则 ， 别 用 并 发 。 


同样 地 ， 性 能 增益 可 能 会 小 于 预期 ; 因为 操作 系统 需要 分 配 内 核 相 关 资 源 和 堆栈 空间 ， 所 以 
在 启动 线程 时 存在 固有 的 开销 ， 然 后 才能 把 新 线程 加 入 调度 器 中 ， 所 有 这 一 切 都 需要 时 间 。 
如 果 在 线程 上 的 任务 完成 得 很 快 ， 那么 任务 实际 执行 的 时 间 要 比 启 动 线程 的 时 间 小 很 多 ， 这 
就 会 导致 应 用 程序 的 整体 性 能 还 不 如 直接 使 用 “产生 线程 "的 方式 。 


此 外 ， 线 程 是 有 限 的 资源 。 如 果 让 太 多 的 线程 同时 运行 ， 则 会 消耗 很 多 操作 系统 资源 ， 从 而 
使 得 操作 系统 整体 上 运行 得 更 加 缓慢 。 不 仅 如 此 ， 因 为 每 个 线程 都 需要 一 个 独立 的 堆栈 空 
闻 ， 所 以 运行 太 多 的 线程 也 会 耗 尽 进程 的 可 用 内 存 或 地 址 空间 。 对 于 一 个 可 用 地 址 空间 为 
4GB(32bit) 的 平坦 架构 的 进程 来 说 ， 这 的 确 是 个 问题 : 如 果 每 个 线程 都 有 一 个 1MB 的 堆栈 (很 


多 系统 都 会 这 样 分 配 )， 那 么 4096 个 线程 将 会 用 尽 所 有 地 址 空间 ， 不 会 给 代码 、 静 态 数 据 或 者 
堆 数 据 留 有 任何 空间 。 即 便 64 位 (或 者 更 大 ) 的 系统 不 存在 这 种 直接 的 地 址 空间 限制 ， 但 其 他 资 
源 有 限 : 如 果 你 运行 了 太 多 的 线程 ， 最 终 也 是 出 会 问题 的 。 尽 管线 程 池 ( 参 见 第 9 章 ) 可 以 用 来 

限制 线程 的 数量 ， 但 这 也 并 不 是 什么 灵丹妙药 ， 它 也 有 自己 的 问题 。 


当 客 户 端 /服务 器 (C/S) 应 用 在 服务 器 端 为 每 一 个 链接 启动 一 个 独立 的 线程 ， 对 于 少量 的 链接 是 
可 以 正常 工作 的 ， 但 当 同 样 的 技术 用 于 需要 处 理 大量 链 接 的 高 需求 服务 器 时 ， 也 会 因为 线程 
太 多 而 耗 尽 系统 资源 。 在 这 种 场景 下 ， 使 用 线程 池 可 以 对 性 能 产生 优化 (参见 第 9 章 ) 。 


最 后 ， 运 行 越 多 的 线程 ， 操 作 系统 就 需要 做 越 多 的 上 下 文 切换 ， 每 一 次 切换 都 需要 耗费 本 可 
以 花 在 有 价值 工作 上 的 时 间 。 所 以 在 某 些 时 候 ， 增 加 一 个 额外 的 线程 实际 上 会 降低 ， 而 非 提 
高 应 用 程序 的 整体 性 能 。 为 此 ， 如 果 你 试图 得 到 系统 的 最 佳 性 能 ， 可 以 考虑 使 用 硬件 并 发 (或 
不 用 )， 并 调整 运行 线程 的 数量 。 

为 性 能 而 使 用 并 发 就 像 所 有 其 他 优化 策略 一 样 : 它 拥有 大 幅度 提高 应 用 性 能 的 潜力 ， 但 它 也 可 
能 使 代码 复杂 化 ， 使 其 更 难 理解 ， 并 更 容易 出 错 。 因 此 ， 只 有 应 用 中 具有 显著 增益 潜力 的 性 
能 关键 部 分 ， 才 值得 并 发 化 。 当 然 ， 如 果 性 能 收益 的 潜力 仅 次 于 设计 清晰 或 关注 点 分 离 ， 可 
能 也 值得 使 用 多 线程 设计 。 


假设 你 已 经 决定 确实 要 在 应 用 中 使 用 并 发 ， 无 论 是 为 了 性 能 、 关 注 点 分 离 ， 亦 或 是 因为 多 线 
程 星期 一 (multithreading Monday)( 译 者 : 可 能 是 学 习 多 线程 的 意思 )。 


问题 又 来 了 ， 对 于 C++ 程 序 员 来 说 ， 多 线程 意味 着 什么 ? 


[1] “The Free Lunch Is Over: A Fundamental Turn Toward Concurrency in Software,” Herb 
Sutter, Dr. Dobb’s Journal, 30(3), March 2005. http://www.gotw.ca/publications/concurrency- 
ddj.htm. 


1.3 C++ 中 的 并 发 和 多 线程 
通过 多 线程 为 C++ 并 发 提供 标准 化 支持 是 件 新 鲜 事 。 只 有 在 C++11 标 准 下 ， 才 能 编写 不 依赖 平 
台 扩 展 的 多 线程 代码 。 了 解 C++ 线 程 库 中 的 众多 规则 前 ， 先 来 了 解 一 下 其 发 展 的 历史 。 


1.3.1 C++ 多 线程 历史 


C++98(1998) 标 准 不 承认 线程 的 存在 ， 并 且 各 种 语言 要 素 的 操作 效果 都 以 顺序 抽象 机 的 形式 编 
写 。 不 仅 如 此 ， 内 存 模 型 也 没有 正式 定义 ， 所 以 在 C++98 标 准 下 ， 没 办 法 在 缺少 编译 器 相关 
扩展 的 情况 下 编写 多 线程 应 用 程序 。 


当然 ， 编 译 器 供应 商 可 以 自由 地 向 语言 添加 扩展 ， PEC EED 充 行 的 多 线程 API 
POSIX 标 准 中 的 C 标 准 和 Microsoft Windows API 中 的 那些 这 就 使 得 很 多 C++ 编 译 器 供 
应 商 通过 各 种 平台 相关 扩展 来 支持 多 线程 。 这 种 编译 器 支持 一 般 受 限于 只 能 使 用 平台 相关 的 C 
语言 API， 并 且 该 C++ 运行 库 ( 例 如 ,异常 处 理 机 制 的 代码 ) 能 在 多 线程 情况 下 正常 工作 。 因 为 编 

器 和 处 理 器 的 实际 表现 很 不 错 了 ， 所 以 在 少数 编译 器 供应 商 提供 正式 的 多 线程 感知 内 存 模 
ne ， 程 序 员 们 已 经 编写 了 大 量 的 C++ 多 线程 程序 了 。 








由 于 不 满足 于 使 用 平台 相关 的 C 语 言 API 来 处 理 多 线程 ，C++ 程 序 员 们 希望 使 用 的 类 库 能 提供 
面向 对 象 的 多 线程 工具 。 像 MFC 这 样 的 应 用 框架 ， 如 同 Boost 和 ACE 这 样 的 已 积累 了 多 组 类 的 
通用 C++ 类 库 ， 这 些 类 封装 了 底层 的 平台 相关 API， 并 提供 用 来 简化 任务 的 高 级 多 线程 工具 。 
各 种 类 和 库 在 细节 方面 差异 很 大 ， 但 在 启动 新 线程 的 方面 ， 总 体 构 造 却 大 同 小 异 。 一 个 为 许 
多 C++ 类 和 库 共 有 的 设计 ， 同 时 也 是 为 程序 员 提 供 很 大 便利 的 设计 ， 也 就 是 使 用 带 锁 的 获取 资 
源 即 初始 化 (RAII, Resource Acquisition Is Initialization) 的 习惯 ， 来 确保 当 退 出 相关 作用 域 时 
互 斥 元 解锁 。 


写 多 线程 代码 需要 坚实 的 编程 基础 ， 当 前 的 很 多 C++ 编译 器 为 多 线程 编程 者 提供 了 对 应 ( 平 
台 相 关 ) 的 API ; 当然 ， 还 有 一 些 与 平台 无 关 的 C++ 类 库 ( 例 如 :Boost 和 ACE)。 正 因为 如 此 ， 程 
序 员 们 可 以 通过 这 些 API 来 实现 多 线程 应 用 。 不 过 ， 由 于 缺乏 统一 标准 的 支持 ， seers 
程 内 存 模型 ， 进 而 导致 一 些 问 题 ， 这 些 问题 在 跨 硬件 或 跨 平台 相关 的 多 线程 应 用 上 表现 得 
为 明显 。 


1.3.2 新 标准 支持 并 发 


所 有 的 这 些 随 着 C++11 标 准 的 发 布 而 改变 了 ， 新 标准 中 不 仅 有 了 一 个 全 新 的 线程 感知 内 存 模 
型 ，C++ 标 准 库 也 扩展 了 : 包含 了 用 于 管理 线程 (参见 第 2 章 )、 保 护 共享 数据 (参见 第 3 章 )、 线 
程 间 同步 操作 (参见 第 4 章 )， 以 及 低级 原子 操作 (参见 第 5 章 ) 的 各 种 类 。 


新 C++ 线程 库 很 大 程度 上 ， 是 基于 上 文 提 到 的 C++ 类 库 的 经 验 积 累 。 特 别 是 ，Boost 线 程 库 作 
为 新 类 库 的 主要 模型 ， 很 多 类 与 Boost 库 中 的 相关 类 有 着 相同 名 称 和 结构 。 随 着 C++ 标准 的 进 
步 ，Boost 线 程 库 也 配合 着 C++ 标准 在 许多 方面 做 出 改变 ， 因 此 之 前 使 用 Boost 的 用 户 将 会 发 
现 自己 非常 熟悉 C+t+11 的 线程 库 。 


如 本 章 起 始 提 到 的 那样 ， 支 持 并 发 仅仅 是 C++ 标准 的 变化 之 一 ， 此 外 还 有 很 多 对 于 编程 语言 自 
身 的 改善 ， 就 是 为 了 让 程序 员 们 的 工作 变 得 更 加 轻松 。 这 些 内 容 在 本 书 的 论述 范围 之 外 ， 但 
是 其 中 的 一 些 变化 对 于 线程 库 本 身 及 其 使 用 方式 产生 了 很 大 的 影响 。 附 录 A 会 对 这 些 特性 做 一 
些 介绍 。 


新 的 C++ 标准 直接 支持 原子 操作 ， 人 允许 程序 员 通 过 定义 语义 的 方式 编写 高 效 的 代码 ， 从 而 无 需 
了 解 与 平台 相关 的 汇编 指令 。 这 对 于 试图 编写 高 效 、 可 移植 代码 的 程序 员 们 来 说 是 一 个 好 消 
息 ; 编译 器 不 仅 可 以 搞定 具体 平台 ， 还 可 以 编写 优化 器 来 解释 操作 语义 ， 从 而 让 程序 整体 得 
到 更 好 的 优化 。 


1.3.3 C++ 线 程 库 的 效率 


通常 情况 下 ， 这 是 高 性 能 计算 开发 者 对 C++ 的 担忧 之 一 。 为 了 效率 ，C++ 类 整合 了 一 些 底层 工 
具 。 这 样 就 需要 了 解 相关 使 用 高 级 工具 和 使 用 低级 工具 的 开销 差 ， 这 个 开销 差 就 是 抽象 代价 
(abstraction penalty) ° 


C++ 标准 委员 会 在 设计 标准 库 时 ， 特 别 是 设计 标准 线程 库 的 时 候 ， 就 已 经 注意 到 了 这 点 ; 目的 
就 是 在 实现 相同 功能 的 前 提 下 ， 直 接 使 用 底层 API 并 不 会 带 来 过 多 的 性 能 收益 。 因 此 ， 该 类 库 
在 大 部 分 主流 平台 上 都 能 实现 高 效 ( 带 有 非常 低 的 抽象 代价 )。 


C++ 标 准 委员 会 为 了 达到 终极 性 能 ， 需 要 确保 C++ 能 给 那些 要 与 硬件 打交道 的 程序 员 ， 提 供 足 
够 多 的 的 底层 工具 。 为 了 这 个 目的 ， 伴 随 着 新 的 内 存 模 型 ， 出 现 了 一 个 综合 的 原子 操作 库 ， 
可 用 于 直接 控制 单个 位 、 字 节 、 内 部 线程 间 同 步 ， 以 及 所 有 变化 的 可 见 性 。 原 子 类 型 和 相应 
的 操作 现在 可 以 在 很 多 地 方 使 用 ， 而 这 些 地 方 以 前 可 能 使 用 的 是 平台 相关 的 汇编 代码 。 使 用 
了 新 标准 的 代码 会 具有 更 好 的 可 移植 性 ， 而 且 更 容易 维护 。 


C++ 标 准 库 也 提供 了 更 高 级 别 的 抽象 和 工具 ， 使 得 编写 多 线程 代码 更 加 简单 ， 并 且 不 易 出 错 。 
有 了 时 运用 这 些 工具 确实 会 带 来 性 能 开销 ， 因 为 有 额外 的 代码 必须 执行 。 但 是 ， 这 种 性 能 成 本 
并 不 一 定 意味 着 更 高 的 抽象 代价 ; 总 体 来 看 ， 这 种 性 能 开销 并 不 比 手 工 编写 等 效 函 数 高 ， 而 
且 编 译 器 可 能 会 很 好 地 内 联 大 部 分 额外 代码 © 


某 些 情况 下 ， 高 级 工具 会 提供 一 些 额外 的 功能 。 大 部 分 情况 下 这 都 不 是 问题 ， 因 为 你 没有 为 
你 不 使 用 的 那 部 分 买单 。 在 罕见 的 情况 下 ， 这 些 未 使 用 的 功能 会 影响 其 他 代码 的 性 能 。 如 果 
你 很 看 重 程序 的 性 能 ， 并 且 高 级 工具 带 来 的 开销 过 高 ， 你 最 好 是 通过 较 低级 别 的 工具 来 实现 
你 需要 的 功能 。 绝 大 多 数 情况 下 ， 人 额外 增加 的 复杂 性 和 出 错 几率 都 远大 于 性 能 的 小 幅 提 升 带 
来 的 收益 。 即 便 是 有 证 据 确实 表明 瓶颈 出 现在 C++ 标 准 库 的 工具 中 ， 也 可 能 会 昌 答 于 低劣 的 应 


用 设计 ， 而 非 低劣 的 类 库 实现 。 例 如 ， 如 果 过 多 的 线程 竞争 一 个 互 斥 单元 ， 将 会 很 明显 的 影 
响 性 能 。 与 其 在 互 斤 操作 上 耗费 时 间 ， 不 如 重新 设计 应 用 ， 减 少 互 斥 元 上 的 竞争 来 得 划算 。 
如 何 减 少 应 用 中 的 竞争 ， 会 在 第 8 章 中 再 次 提 及 。 


在 C++ 标准 库 没 有 提供 所 需 的 性 能 或 行为 时 ， 就 需要 使 用 与 平台 相关 的 工具 。 


1.3.4 平台 相关 的 工具 


虽然 C++ 线程 库 为 多 线程 和 并 发 处 理 提 供 了 较 全 面 的 工具 ， 但 在 菜 些 平台 上 提供 额外 的 工具 。 
为 了 方便 地 访问 那些 工具 的 同时 ， 又 使 用 标准 C++ 线程 库 ， 在 C++ 线程 库 中 提供 一 

个 native_handle() 成 员 有 函数 ， 人 允许 通过 使 用 平台 相关 API 直 接 操作 底层 实现 。 就 其 本 质 而 
言 ， 任 何 使 用 native_handle() 执行 的 操作 都 是 完全 依赖 于 平台 的 ， 这 超出 了 本 书 (同时 也 是 


标准 C++ 库 本 身 ) 的 范围 。 
所 以 ， 使 用 平台 相关 的 工具 之 前 ， 要 明白 标准 库 能 够 做 什么 ， 那 么 下 面 通过 一 个 果子 来 展示 
Fe o 


1.4 开始 入 门 


ok ! 现在 你 有 一 个 能 与 C++11 标 准 兼容 的 编译 器 。 接 下 来 呢 ? 一 个 C++ 多 线程 程序 是 什么 样子 
呢 ? 其 实 ， 它 看 上 去 和 其 他 C++ 程序 差不多 ， 通 常 是 变量 、 类 以 及 函数 的 组 合 。 唯 一 的 区 别 在 
于 某 些 函数 可 以 并 发 运行 ， 所 以 需要 确保 共享 数据 在 并 发 访问 时 是 安全 的 ， 详 见 第 3 章 。 当 
然 ， 为 了 并 发 地 运行 函数 ， 必 须 使 用 特定 的 函数 以 及 对 象 来 管理 各 个 线程 。 


1.4.1 你 好 ， 并 发 世界 


从 一 个 经 典 的 例子 开始 : 一 个 打印 “Hello World. ”的 程序 。 一 个 非常 简单 的 在 单线 程 中 运行 的 
Hello World 程 序 如 下 所 示 ， 当 我 们 谈 到 多 线程 时 ， 它 可 以 作为 一 个 基准 。 


#include <iostream> 


int main() 
{ 

std::cout << “Hello World\n"; 
} 


这 个 程序 所 做 的 就 是 将 “Hello World” 写 进 标准 输出 流 。 让 我 们 将 它 与 下 面 清单 所 示 的 简单 
的 “Hello, Concurrent World” 程 序 做 个 比较 ， 它 启动 了 一 个 独立 的 线程 来 显示 这 个 信息 。 


清单 1.1 一 个 简单 的 Hello, Concurrent World 程 序 : 
#include <iostream> 


#include <thread> //Q 
void hello() //® 


{ 
std::cout << "Hello Concurrent World\n"; 
} 
int main() 
{ 


std::thread t(hello); //@® 
t.join(); //® 


第 一 个 区 别 是 增加 了 #include <thread> ®© , 标 准 C++ 库 中 对 多 线程 支持 的 声明 在 新 的 头 文件 
中 : 管理 线程 的 函数 和 类 在 <thread> 中 声明 ， 而 保护 共享 数据 的 函数 和 类 在 其 他 头 文 件 中 声 
明 o 


其 次 ， 打 印信 息 的 代码 被 移动 到 了 一 个 独立 的 函数 中 回 。 因 为 每 个 线程 都 必须 具有 一 个 初始 函 
数 (initial function)， 新 线程 的 执行 从 这 里 开始 。 对 于 应 用 程序 来 说 ， 初 始 线程 是 main()， 但 是 
对 于 其 他 线程 ， 可 以 在 std::thread 4 RAH HAR F I L—_AB] F > HP SZ A© 

的 std::thread 3t R4AA HH A žrhello( NE A Hiss HA o 


下 一 个 区 别 : 与 直接 写 入 标准 输出 或 是 从 main() 调 用 hello() 不 同 ， 该 程序 启动 了 一 个 全 新 的 线 
程 来 实现 ， 将 线程 数量 一 分 为 二 初始 线程 始 于 main()， 而 新 线程 始 于 hello()。 


新 的 线程 启动 之 后 国 ， 初 始 线程 继续 执行 。 如 果 它 不 等 待 新 线程 结束 ， 它 就 将 自 顾 自 地 继续 运 
行 到 main() 的 结束 ， 从 而 结束 程序 一 一 有 可 能 发 生 在 新 线程 运行 之 前 。 这 就 是 为 什么 在 四 这 里 
调用 join() 的 原因 详 见 第 2 章 i 这 会 导致 调用 线程 (在 main() 中 ) 等 待 与 std::thread 对 象 
相关 联 的 线程 ， 即 这 个 例子 中 的 t。 





这 看 起 来 仅仅 为 了 将 一 条 信息 写 入 标准 输出 而 做 了 大 量 的 工作 ， 确 实 如 此 一 一 正如 上 文 1.2.3 
节 所 描述 的 ， 一 般 来 说 并 不 值得 为 了 n A 线程 ， 尤 其 是 在 这 期 间 初 始 线 
程 并 没 做 什么 。 本 书后 面 的 内 容 中 ， 将 通过 实例 来 展示 在 哪些 情景 下 使 用 多 线程 可 以 获得 收 


ve 
im © 


1.5 本 和 草 总 结 


本 章 中 ， 提 及 了 并 发 与 多 线程 的 含义 ,以 及 在 你 的 应 用 程序 中 为 什么 你 会 选择 使 用 (或 不 使 用 ) 
它 。 还 提 及 了 多 线程 在 C++ 中 的 发 展 历程 ， 从 1998 标 准 中 完全 缺乏 支持 ， 经 历 了 各 种 平台 相 
关 的 扩展 ， 再 到 新 的 C++11 标 准 中 具有 合适 的 多 线程 支持 。 芯 片 制造 商 选择 了 以 多 核心 的 形 
式 ， 使 得 更 多 任务 可 以 同时 执行 的 方式 来 增加 处 理 能 力 ， 而 不 是 增加 单个 核心 的 执行 速度 。 
在 这 个 趋势 下 ，C++ 多 线程 来 的 正 是 时 候 ， 它 使 得 程序 员 们 可 以 利用 新 的 CPU， 带 来 的 更 加 
强大 的 硬件 并 发 。 


使 用 1.4 节 中 例子 ， 展 示 C++ 标 准 库 中 的 类 和 函数 有 多 人 么 的 简单 。C++ 中 使 用 多 线程 并 不 复 
杂 ， 复 杂 的 是 如 何 设计 代码 以 实现 其 预期 的 行为 。 


尝试 了 1.4 节 的 示例 后 ， 是 时 候 看 看 更 多 实质 性 的 内 容 了 。 


第 2 章 中 ， 我 们 将 了 解 一 下 用 于 管理 线程 的 类 和 函数 。 


好 的 | 看 来 你 已 经 决定 使 用 多 线程 了 。 先 做 点 什么 呢 ? 局 动 线程 、 结 束 线程 ， 还 是 如 何 监 管线 
程 ? C++ 标准 库 中 只 需要 管理 stdi :thread 关联 的 线程 ， 无 需 把 注意 力 放 在 其 他 方面 。 不 过 ， 
标准 库 太 灵活 ， 所 以 管理 起 来 不 会 太 容 易 。 

本 章 将 从 基本 开始 : 启动 一 个 线程 ， 等 待 这 个 线程 结束 ， 或 放 在 后 台 运行 。 再 看 看 怎么 给 已 
经 局 动 的 RAL HBG BER 2 以 及 怎 么 将 一 个 线程 的 所 有 权 从 当 前 std::thread 对 RAS LAA 
一 个 。 最 后 ， 再 来 确定 线程 数 ， 以 及 识别 特殊 线程 。 


2.1 线程 管理 的 基础 


每 个 程序 至 少 有 一 个 线程 : 执行 main() 函 数 的 线程 ， 其 余 线程 有 其 各 自 的 入 口 函数 。 线 程 与 原 
始 线程 (以 main() 为 入 口 函 数 的 线程) 同时 运行 。 如 同 main() 函 数 执行 完 会 退出 一 样 ， 当 线程 执 
行 完 入 口 函 数 后 ， 线 程 也 会 退出 。 在 为 一 个 线程 创建 了 一 个 std::thread 对 象 后 ， 需 要 等 待 这 
个 线程 结束 ; 不 过 ， 线 程 需要 先进 行 启动 。 下 面 就 来 启动 线程 。 


2.1.1 司 动 线程 


1 章 中 ， 线 程 在 std: :thread 对 象 创建 (为 线程 指定 任务 ) 时 启 动 。 最 简单 的 情况 下 ， 任 务 也 
会 很 简单 ， 通 常 是 无 参数 无 返回 的 函数 。 这 种 函数 在 其 所 属 线程 上 运行 ， 直 到 函数 执行 完 
毕 ， 线 程 也 就 结束 了 。 在 一 些 极端 情况 下 ， 线 程 运 行 时 ， 任 务 中 的 函数 对 象 需 要 通过 某 种 通 
讯 机 制 进行 参数 的 传递 ， 或 者 执行 一 系列 独立 操作 ;可 以 通过 通讯 机 制 传递 信号 ， 让 线程 停 
止 。 线 程 要 做 什么 ， 以 及 什么 时 候 启 动 ， 其 实 都 无 关 紧 要 。 总 之 ， 使 用 C++ 线程 库 局 动 线程 ， 
可 以 归结 为 构造 std::thread 对 象 : 


void do_some_work(); 
std::thread my_thread(do_some_work); 


A 了 让 编译 器 识别 std::thread 类 ， 这 个 简单 的 例子 也 要 包含 <thread> 头 文件 。 如 同 大 多 数 
C++ 标准 库 一 样 > std::thread 可 以 用 可 调用 类 型 构造 ? 将 带 有 有 函数 调用 符 类 型 的 实例 传 
入 std::thread RP > BRR WIE HH © 


class background_task 
{ 
public: 
void operator()() const 
{ 
do_something(); 
do_something_else(); 
} 
}; 


background_task f; 
std::thread my_thread(f); 


代码 中 ， ee 〗 新 线程 的 存储 空间 当中 ， 函 数 对 象 的 执行 和 调用 都 在 线程 
的 内 存 空间 中 进行 。 哆 数 对 象 的 副本 应 与 原始 函数 对 象 保 持 一 致 ， 否 则 得 到 的 结果 会 与 我 们 
的 期 望 不 同 。 


有 件 事 需 要 注意 ， 当 把 函数 对 象 传 入 到 线程 构造 函数 中 时 ， 需 要 避免 "最 令 人 头痛 的 语法 解 
et ie el 。 如 果 你 传递 了 一 个 临时 变量 ， 而 不 是 一 个 命名 的 变 
; C++ 编译 器 会 将 其 解析 为 函数 声明 ， 而 不 是 类 型 对 象 的 定义 。 


例如 : 


std::thread my_thread(background_task()); 


KEM SPU ST -—+4Amy_threads) HA > Rh HRA -PRA( MAH MAAK 
数 并 返回 background _ task 对象 的 函数 )， 返 回 一 个 std::thread 对 和 象 的 函数 ， 而 非 启动 了 一 个 
线程 。 


使 用 在 前 面 命名 元 数 对 痊 的 方式 ， 或 使 用 多 组 括号 @， 或 使 用 新 统一 的 初始 化 语法 加 ， 可 以 避 
免 这 个 问题 。 


如 下 所 示 : 


std::thread my_thread((background_task())); // 1 
std::thread my_thread{background_task()}; Lee 


使 用 lambda 表 达 式 也 能 避免 这 个 问题 。lambda 表 达 式 是 C++11 的 一 个 新 特性 ， 它 允许 使 用 一 
个 可 以 捕获 局 部 变量 的 局 部 函数 (可 以 避免 传递 参数 ， 参 见 2.2 节 )。 想 要 具体 的 了 解 lambda 表 
达 式 ， 可 以 阅读 附录 A 的 A.5 节 。 之 前 的 例子 可 以 改写 为 lambda 表 达 式 的 类 型 : 


std::thread my_thread([]{ 
do_something(); 
do_something_else(); 


}); 





启动 了 线程 ， 你 需要 明确 是 要 等 待 线程 结束 (加 入 式 参见 2.1.2 节 )， 还 是 让 其 自主 运行 (分 
离 式 参见 2.1.3 节 )。 如 果 std::thread 对 象 销 毁 之 前 还 没有 做 出 决定 ， 程 序 就 会 终止 

( std::thread 的 析 构 函数 会 调用 std::terminate() )。 因 此 ， 即 便 是 有 异常 存在 ， 也 需要 确保 
线程 能 够 正确 的 加 入 (joined) 或 分 离 (detached)。2.1.3 节 中 ， 会 介绍 对 应 的 方法 来 处 理 这 两 种 
情况 。 需 要 注意 的 是 ， 必 须 在 std::thread 对 m 长 之 前 做 出 决定 ， 否 则 你 的 程序 将 会 终止 
(std::thread 的 析 构 函数 会 调用 std::terminate()， 这 时 再 去 决定 会 触发 相应 异常 )。 





不 是 一 个 新 问题 


如 果 不 等 待 线程 ， 就 必须 保证 线程 结束 之 前 ， 可 访问 的 数据 得 有 效 性 。 这 不 
不 过 ， 线 程 的 生命 周 


一 一 单线 程 代码 中 ， 对 象 销毁 之 后 再 去 访问 ， 也 会 产生 未 定义 行为 
期 增加 了 这 个 问题 发 生 的 几率 。 





这 种 情况 很 可 能 发 生 在 线程 还 没 结束 ， 函 数 已 经 退出 的 时 候 ， 这 时 线程 函数 还 持 有 函数 局 部 
变量 的 指针 或 引用 。 下 面 的 清单 中 就 展示 了 这 样 的 一 种 情况 。 


清单 2.1 函数 已 经 结束 ， 线 程 依旧 访问 局 部 变量 


struct func 


{ 
int& i; 
func(int& i_) : i(i ) {} 
void operator() () 
{ 
for (unsigned j=0 ; j<1000000 ; ++j) 
{ 
do_something(i); // 1. 潜在 访问 隐患: 悬空 引用 
} 
} 
J; 
void oops() 
{ 
int some_local_state=0; 
func my_func(some_local_state); 
std::thread my_thread(my_func); 
my_thread.detach(); // 2. 不 等 待 线程 结束 
} // 3. 新 线程 可 能 还 在 运行 


这 个 例子 中 ， 已 经 决定 不 等 待 线程 结束 (使 用 了 detach()@)， 所 以 当 oops() 有 函数 执行 完成 时 

加 ， 新 线程 中 的 函数 可 能 还 在 运行 。 如 果 线 程 还 在 运行 ， 它 就 会 去 调用 do_something(i) 函 数 
@， 这 时 就 会 访问 已 经 销毁 的 变量 。 如 同一 个 单线 程 程序 一 允许 在 函数 完成 后 继续 持 有 局 部 
变 
会 





变量 的 指针 或 引用 ; 当然 ， 这 从 来 就 不 是 一 个 好 主意 一 一 这 种 情况 发 生 时 ， 错 误 并 不 明显 ， 
使 多 线程 更 容易 出 错 。 





处 理 这 种 情况 的 常规 方法 : 使 线程 函数 的 功能 齐全 ， 将 数据 复制 到 线程 中 ， 而 非 复 制 到 共享 
数据 中 。 如 果 使 用 一 个 可 调用 的 对 象 作为 线程 函数 ， 这 个 对 象 就 会 复制 到 线程 中 ， 而 后 原始 
对 象 就 会 立即 销毁 。 但 对 于 对 象 中 包含 的 指针 和 引用 还 需 谨 峙 ， 例 如 清单 2.1 所 示 。 使 用 一 个 
能 访问 局 部 变量 的 函数 去 创建 线程 是 一 个 糟糕 的 主意 (除非 十 分 确定 线程 会 在 函数 完成 前 结 

束 )。 此 外 ， 可 以 通过 join() 函 数 来 确保 线程 在 函数 完成 前 结束 。 


2.1.2 等 待 线程 完成 


如 果 需 要 等 待 线 程 ， 相 关 的 std::thread 实例 需要 使 用 join()。 清 单 2.1 中 > 

detach() 替换 为 my_thread.join() ， 就 可 以 确保 局 部 变量 在 线程 完成 后 ， 才 被 
。 在 这 种 情况 下 ， 因 为 原始 线程 在 其 生命 周期 中 并 没有 做 什么 事 ， 使 得 setae 

ee 变 得 收益 其 微 ， 但 在 实际 编程 中 ， 原 始 线程 要 么 有 自己 的 工作 要 做 ; BA 

动 多 个 子 线程 来 做 一 些 有 用 的 工作 ， 并 等 待 这 些 线程 结 


join() 是 简单 粗暴 的 等 待 线程 完成 或 不 等 待 。 当 你 需要 对 等 待 中 的 线程 有 更 灵活 的 控制 时 ， 比 
如 ， a FRR AE & EG? 本 ， 或 者 只 等 待 一 段 时 间 ( 超 过 时 间 就 判定 为 超时 )。 想 要 做 到 这 

些 ， ep tre ee 比如 条 件 变量 和 期 待 (futures)， 相 关 的 讨论 将 会 在 第 4 章 继 
。 调 用 join() 的 行为 ， 还 清理 了 线程 相关 的 存储 部 分 ， 这 样 std::thread 对 象 将 不 再 与 已 经 
o ae ， 只 能 对 一 个 线程 使 用 一 次 join(); 一 旦 已 经 使 用 过 

join() > std: :thread 对 象 就 不 能 再 次 加 入 了 ， 当 对 其 使 用 joinable() 时 ， 将 返回 false 。 


ke 


aa 


2.1.3 特殊 情况 下 的 等 待 


如 前 所 述 ， 需 要 对 一 个 还 未 销毁 的 std::thread 对 象 使 用 join() 或 detach()。 如 果 想 要 分 离 一 个 
线程 ， 可 以 在 线程 启动 后 ， 直 接 使 用 detach() 进 行 分 离 。 如 果 打 算 等 待 对 应 线程 ， 则 需要 细心 
A A 当 在 线程 运行 之 后 产生 异常 ， 在 join() 调 用 之 前 抛 出 ， 就 意味 着 这 次 调 
用 会 被 跳 过 


避免 应 用 被 抛 出 的 异常 所 终止 ， 就 需要 作出 一 个 决定 。 通 常 ， 当 倾向 于 在 无 异常 的 情况 下 使 
用 join() 时 ， 需 要 在 异常 处 理 过 程 中 调用 join()， 从 而 避免 生命 周期 的 问题 。 下 面 的 程序 清单 是 
一 个 例子 。 


清单 2.2 等 待 线 程 完成 


struct func; // 定义 在 清单 2.1 中 
void f() 
{ 
int some_local_state=0; 
func my_func(some_local_state); 
std::thread t(my_func); 
try 
{ 
do_something_in_current_thread(); 
} 
catch(...) 
{ 
Ge OLIN) /A 
throw; 


} 
Ce Out /2 


清单 2.2 中 的 代码 使 用 了 try/catch R44 Ri AHR A g RARE HG > HAA AR o 4 BR 
正常 退出 时 ， 会 执行 到 @ 处 ; SHRUAAREP WHA > FASANO © try/catch 块 
能 轻易 的 捕获 轻 量 级 错误 ， 所 以 这 种 情况 ， 并 非 放 之 四 海 而 尼 准 。 如 需 确 保 线 程 在 函数 之 前 

结束 查看 是 否 因为 线程 函数 使 用 了 局 部 变量 的 引用 ， 以 及 其 他 原因 而 后 再 确定 一 下 

程序 可 能 会 退出 的 途径 ， 无 论 正 常 与 否 ， 可 以 提供 一 个 简洁 的 机 制 ， 来 做 解决 这 个 问题 。 








一 种 方式 是 使 用 "资源 获取 即 初始 化 方式 "(RAII，Resource Acquisition Is Initialization) > # -£ 
提供 一 个 类 ， 在 析 构 函数 中 使 用 join()， 如 同 下 面 清 单 中 的 代码 。 看 它 如何 简 化 f() 函 数 。 


清单 2.3 使 用 RAII 等 待 线程 完成 


class thread_guard 
{ 
std::thread& t; 
public: 
explicit thread_guard(std::thread& t_): 
t(t_) 
{} 
~thread_guard() 
{ 
if(t.joinable()) // 1 


{ 
t.join(); // 2 


} 
thread_guard(thread_guard const&)=delete; // 3 


thread_guard& operator=(thread_guard const&)=delete; 


ti 
struct func; // 定义 在 清单 2 ,1 中 


void f() 
{ 
int some_local_state=0; 
func my_func(some_local_state); 
std::thread t(my_func); 
thread_guard g(t); 
do_something_in_current_thread(); 
} // 4 


当 线 程 执行 到 图 处 时 ， 局 部 对 象 就 要 被 逆序 销 贷 了 。 因 此 ，thread guard 对 象 g9 是 第 一 个 被 销 
毁 的 ， 这 时 线程 在 析 构 通 数 中 被 加 入 @ 到 原始 线程 中 。 即 使 do_something_in_current thread 
抛 出 一 个 异常 ， 这 个 销毁 依 昌 会 发 生 。 


在 thread _guard 的 析 构 函数 的 测试 中 ， 首 先 判断 线程 是 否 已 加 入 @@， 如 果 没 有 会 调用 join()@ 
进行 加 入 。 这 很 重要 ， 因 为 join() 只 能 对 给 定 的 对 象 调用 一 次 ， 所 以 对 给 已 加 入 的 线程 再 次 进 
行 加 入 操作 时 ， 将 会 导致 错误 。 

找 贝 构造 函数 和 拷贝 赋值 操作 被 标记 为 =delete 四 ， 是 为 了 不 让 编译 器 自动 生成 它们 。 直 接 
对 一 个 对 象 进行 拷贝 或 赋值 是 危险 的 ， 因 为 这 可 能 会 弄 丢 已 经 加 入 的 线程 。 通 过 删除 声明 ， 
任何 尝试 给 thread guard 对 象 赋值 的 操作 都 会 引发 一 个 编译 错误 。 想 要 了 解 删除 函数 的 更 多 


知识 ， 请 参阅 附录 A 的 A.2 节 。 


如 果 不 想 等 待 线程 结束 ， 可 以 分 离 (de 要 ching) 线 程 ， 从 而 避免 异常 安全 *(exception-safety) 问 
题 。 不 过 ， 这 就 打破 了 线程 与 std: :thread 对 象 的 联系 ， E 然 在 后 台 运 行 着 ， 分 离 操 
作 也 能 确保 std::terminate() 在 stdi:thread 对 象 销毁 才 被 调用 。 


2.1.4 后 台 运 行 线程 


使 用 detach() 会 让 线程 在 后 台 运 行 ， 这 就 意味 着 主线 程 不 能 与 之 产生 直接 交互 。 也 就 是 说 ， 不 
会 等 待 这 个 线程 结束 ; 如 果 线 程 分 离 ， 那 么 就 不 可 能 有 std::thread 对 象 能 引用 它 ， 分 离线 程 
的 确 在 后 台 运 行 ， 所 以 分 离线 程 不 能 被 加 入 。 不 过 C++ 运行 库 保 证 ， 当 线程 退出 时 ， 相 关 资 源 
的 能 够 正确 回收 ， 后 台 线 程 的 归属 和 控制 C++ 运行 库 都 会 处 理 。 


通常 称 分 离线 程 为 守护 线程 (daemon threads),UNIX 中 守护 线程 是 指 ， 没 有 任何 显 式 的 用 户 接 
口 ， 并 在 后 台 运 行 的 线程 。 这 种 线程 的 特点 就 是 长 时 间 运 行 ; 线程 的 生命 周期 可 能 会 从 某 一 
个 应 用 起 始 到 结束 ， 可 能 会 在 后 人 台 监 视 文件 系统 ， 还 有 可 能 对 缓存 进行 清理 ， 亦 或 对 数据 结 
构 进行 优化 。 另 一 方面 ， 分 离线 程 的 另 一 方面 只 能 确定 线程 什么 时 候 结束 ， 发 后 即 忘 (fire and 
forget) 的 任务 就 使 用 到 线程 的 这 种 方式 。 


如 2.1.2 节 所 示 ， 调 用 std::thread 成 员 元 数 detach() 来 分 离 一 个 线程 。 之 后 ， 相 应 
的 std::thread 对 象 就 与 实际 执行 的 线程 无 关 了 ， 并 且 这 个 线程 也 无 法 加 入 : 


std::thread t(do_background_work); 
t.detach(); 
assert(!t.joinable()); 


为 了 从 std::thread 对 象 中 分 离线 程 (前 提 是 有 可 进行 分 离 的 线程 ), 不 能 对 ca RFE 
的 std: :thread 对 象 使 用 detach(), 也 是 join() 的 使 用 条 件 ， 并 且 要 用 同样 的 方式 进行 检查 
当 std::thread 对 象 使 用 tjoinable() 返 回 的 是 true， 就 可 以 使 用 t.detach()。 





SR Rae OD so a ers 
进行 ， 都 有 很 多 的 解决 方法 。 虽 然 ， 这 些 窗口 看 起 来 是 完全 独立 的 ， 每 个 窗口 都 有 自己 独立 
HEBER eM ETEN AENEA RFEA A EN EASA 
口 拥 有 自己 的 线程 ; 每 个 线程 运行 同样 的 的 代码 ， 并 隔离 不 同窗 口 处 理 的 数据 。 如 此 这 般 ， 
打开 一 个 文档 就 要 启动 一 个 新 线程 。 因 为 是 对 独立 的 文档 进行 操作 ， 所 以 没有 必要 等 待 其 他 
线程 完成 。 因 此 ， 这 里 就 可 以 让 文档 处 理 窗口 运行 在 分 离 的 线程 上 。 


下 面 代码 简要 的 展示 了 这 种 方法 : 


清单 2.4 使 用 分 离线 程 去 处 理 其 他 文档 


void edit_document(std::string const& filename) 
{ 
open_document_and_display_gui( filename) ; 
while(!done_editing()) 
{ 
user_command cmd=get_user_input(); 
if(cmd.type==open_new_document ) 
{ 
std::string const new_name=get_filename_from_user(); 
std::thread t(edit_document,new_name); // 1 
t.detach(); // 2 


} 
else 
t 
process_user_input(cmd); 
} 


如 果 用 户 选择 打开 一 个 新 文档 ， 需 要 启动 一 个 新 线程 去 打开 新 文档 四 ， 并 分 离线 程 @。 与 当前 
线程 做 出 的 操作 一 样 ， 新 线程 只 不 过 是 打开 另 一 个 文件 而 已 。 所 以 ，edit_document 部 数 可 以 
复 用 ， 通 过 传 参 的 形式 打开 新 的 文件 。 


这 个 例子 也 展示 了 传 参 局 动 线程 的 方法 : 不 仅 可 以 向 std::thread 构造 函数 加 传递 函数 名 ， 还 
可 以 传递 函数 所 需 的 参数 ( 实 参 ) 。C++ 线 程 库 的 方式 也 不 是 很 复杂 。 当 然 ， 也 有 其 他 方法 完成 
这 项 功能 ， 比 如 :使 用 一 个 带 有 数据 成 员 的 成 员 函 数 ， 代 替 一 个 需要 传 参 的 普通 函数 。 


2.2 向 线程 函数 传递 参数 


清单 2.4 中 ， 向 std::thread 构造 函数 中 的 可 调用 对 象 ， 或 函数 传递 一 个 参数 很 简单 。 需 要 注 
意 的 是 ， 默 认 参 数 要 拷贝 到 线程 独立 内 存 中 ， 即 使 参数 是 引用 的 形式 ， 也 可 以 在 新 线程 中 进 
行 访问 。 再 来 看 一 个 例子 : 


void f(int i, std::string const& s); 
std::thread t(f, 3, "hello"); 


代码 创建 了 一 个 调 用 {f(3， "hello") 的 线程 。 注意 ， 范 数 f 需 要 一 个 std: :string 对 象 作为 第 二 个 
参数 ， 但 这 里 使 用 的 是 字符 串 的 字面 值 ， 也 就 是 char const * 类 型 。 之 后 ， 在 线程 的 上 下 文 
中 完成 字面 值 向 std::string 对 象 的 转化 。 需 要 特别 要 注意 ， 当 指 向 动态 变量 的 指针 作为 参数 
传递 给 线程 的 情况 ， 代 码 如 下 : 


void f(int i,std::string const& s); 

void oops(int some_param) 

{ 
char buffer[1024]; // 1 
sprintf(buffer, "%i",Some_param); 
std::thread t(f,3,buffer); // 2 
t.detach(); 


这 种 情况 下 ，buffer@ 是 一 个 指针 变量 ， 指 向 本 地 变量 ， 然 后 本 地 变量 通过 buffer 传 递 到 新 线 
程 中 国 。 并 且 ， 函数 有 很 有 可 能 会 在 字面 值 转化 成 std::string Xt RZ AAA i (Oops) ， 从 而 导 
致 一 些 未 定义 的 行为 g 并 且 想 要 依赖 隐 式 转换 将 字面 值 转换 为 hy BK FAY std::string 对 象 2 
但 因 std::thread 的 构造 函数 会 复制 提供 的 变量 ， 就 只 复制 了 没有 转换 成 期 望 类 型 的 字符 串 字 
面值 。 


解决 方案 就 是 在 传递 到 std: :thread 构造 函数 之 前 就 将 字面 值 转化 为 std: :string 对 象 : 


void f(int i,std::string const& s); 
void not_oops(int some_param) 
{ 
char buffer[1024]; 
sprintf (buffer, "%i",some_param); 
std::thread t(f,3,std::string(buffer)); // ‘std::string’ # 
REE 
t.detach(); 


还 可 能 遇 到 相反 的 情况 : 期 望 传递 一 个 引用 ， 但 整个 对 象 被 复制 了 。 当 线程 更 新 一 个 引用 传 
递 的 数据 结构 时 ， 这 种 情况 就 可 能 发 生 ， 比 如 : 


void update_data_for_widget(widget_id w,widget_data& data); // 1 
void oops_again(widget_id w) 
{ 
widget_data data; 
std::thread t(update_data_for_widget,w,data); // 2 
display_status(); 
t.join(); 
process _widget_data(data); // 3 


虽然 update data_ for widget@ 的 第 二 个 参数 期 待 传 入 一 个 引用 ， 但 是 std::thread 49793 h 
数 @ 并 不 知晓 ; 构造 函数 无 视 函 数 期 待 的 参数 类 型 ， 并 育 目 的 拷贝 已 提供 的 变量 。 当 线程 调用 
update_data_for widget 有 函数 时 ， 传 递 给 函数 的 参数 是 data 变 量 内 部 找 贝 的 引用 ， 而 非 数 据 本 
身 的 引用 。 因 此 ， 当 线程 结束 时 ， 内 部 捞 贝 数据 将 会 在 数据 更 新 阶段 被 销毁 ， 且 
process_widget data 将 会 接收 到 没有 修改 的 data 变 量 @@。 可 以 使 用 std::ref 将 参数 转换 成 引 
用 的 形式 ， 从 而 可 将 线程 的 调用 改 为 以 下 形式 : 


std::thread t(update_data_for_widget,w,std::ref(data) ); 


在 这 之 后 ，update_ data _ for widget 就 会 接收 到 一 个 data 变 量 的 引用 ， 而 非 一 个 data 变 量 拷贝 
的 引用 。 

to RAR BRA std::bind ， 就 应 该 不 会 对 以 上 述 传 参 的 形式 感到 奇怪 ， 因 为 std::thread His BH 
数 和 std: :bind 的 操作 都 在 标准 库 中 定义 好 了 ， 可 以 传递 一 个 成 员 函 数 指针 作为 线程 函数 ， 
并 提供 一 个 合适 的 对 象 指针 作为 第 一 个 参数 : 


class X 
{ 
public: 
void do_lengthy_work(); 
}; 
X my_x; 
std::thread t(&X::do_lengthy_work,&my_x); // 1 


这 段 代码 中 ， 新 线程 将 my_x.do_lengthy_work() 作 为 线程 函数 ; my_x 的 地 址 @ 作 为 指针 对 象 
提供 给 函数 。 也 可 以 为 成 员 函 数 提 供 参 数 : std::thread 构造 函数 的 第 三 个 参数 就 是 成 员 函 数 
的 第 一 个 参数 ， 以 此 类 推 (代码 如 下 ， 译 者 自 加 )。 


class X 
{ 
public: 
void do_lengthy_work(int); 
}; 
X my_x; 
int num(0); 
std::thread t(&X::do_lengthy_work, &my_x, num); 


有 趣 的 是 ， 提 供 的 参数 可 以 移动 ， 但 不 能 找 贝 。" 移 动 " 是 指 :原始 对 象 中 的 数据 转移 给 另 一 对 
象 ， 而 转移 的 这 些 数据 就 不 再 在 原始 对 象 中 保存 了 ( 译 者 : 比较 像 在 文本 编辑 的 " 剪 切 " 操 

作 )。 std::unique_ptr 就 是 这 样 一 种 类 型 ( 译 者 : C++11 中 的 智能 指针 )， 这 种 类 型 为 动态 分 配 
的 对 象 提 供 内 存 自动 管理 机 制 ( 译 者 : 类 似 垃 圾 回收 )。 同 一 时 间 内 ， 只 允许 一 

个 std::unique_ptr 实现 指向 一 个 给 定 对 象 ， 并 且 当 这 个 实现 销毁 时 ， 指 向 的 对 象 也 将 被 删 

除 。 移 动 构造 函数 (move constructor) 和 移动 赋值 操作 符 (move assignment operator) 允 许 一 个 
对 象 在 多 个 std::unique_ptr 实现 中 传递 4 有关" 移动 "的 更 多 内 容 ， 请 参考 附录 A 的 A.1.1 节 ) 。 
使 用 "移动 "转移 原 对 象 后 ， 就 会 留 下 一 个 空 指针 (NULL)。 移 动 操作 可 以 将 对 象 转换 成 可 接受 的 
类 型 ， 例 如 :函数 参数 或 函数 返回 的 类 型 。 当 原 对 象 是 一 个 临时 变量 时 ， 自 动 进 行 移动 操作 ， 
但 当 原 对 象 是 一 个 命名 变量 ， 那 么 转移 的 时 候 就 需要 使 用 std: :move() 进行 显示 移动 。 下 面 的 
代码 展示 了 std: :move 的 用 法 ， 展 示 了 std::move 是 如 何 转移 一 个 动态 对 象 到 一 个 线程 中 去 
的 : 


void process_big_object(std::unique_ptr<big_object>); 


std::unique_ptr<big object> p(new big object); 
p->prepare_data(42); 
std::thread t(process_big_object,std::move(p)); 


在 std::thread 的 构造 函数 中 指定 std::move(p) ,big_object 对 象 的 所 有 权 就 被 首先 转移 到 新 
创建 线程 的 的 内 部 存储 中 ， 之 后 传递 给 process_big_object 函 数 。 


标准 线程 库 中 和 std::unique_ptr 在 所 属 权 上 有 相似 语义 类 型 的 类 有 好 几 种 ， std::thread 为 
其 中 之 一 °> 虽然 ， std::thread 实例 不 像 std: :unique_ptr 那样 能 占有 一 个 动态 对 象 的 所 有 

权 ， 但 是 它 能 占有 其 他 资源 : 每 个 实例 都 负责 管理 一 个 执行 线程 。 执 行 线程 的 所 有 权 可 以 在 
多 个 std::thread 实例 中 互相 转移 ， 这 是 依赖 于 std::thread 实例 的 可 移动 且 不 可 复制 性 。 不 
可 复制 保 性 证 了 在 同一 时 间 点 ， 一 个 std::thread 实例 只 能 关联 一 个 执行 线程 ; 可 移动 性 使 得 
程序 员 可 以 自己 决定 ， 哪 个 实例 拥有 实际 执行 线程 的 所 有 权 。 


2.3 转移 线程 所 有 权 


假设 要 写 一 个 在 后 台 启 动 线 程 的 函数 ， 想 通过 新 线程 返回 的 所 有 权 去 调用 这 个 泡 数 ， 而 不 是 
等 待 线程 结束 再 去 调用 ; 或 完全 与 之 相反 的 想法 : 创建 一 个 线程 ， 并 在 函数 中 转移 所 有 权 ， 
都 必须 要 等 待 线程 结束 。 总 之 ， 新 线程 的 所 有 权 都 需要 转移 。 


这 就 是 移动 引入 std::thread 的 原因 ，C++ 标 准 库 中 有 很 多 资源 占有 (resource-owning) 类 型 ， 
比如 std::ifstream , std::unique_ptr 还 有 std::thread 都 是 可 移动 ， 但 不 可 拷贝 。 这 就 说 明 
执行 线程 的 所 有 权 可 以 在 std::thread 实例 中 移动 ， 下 面 将 展示 一 个 例子 。 例 子 中 ， 创 建 了 两 
个 执行 线程 ， 并 且 在 std::thread 实例 之 间 (t1,t2 和 t3) 转 移 所 有 权 : 


void some_function(); 
void some_other_function(); 


std::thread t1(some_function); // 1 

std::thread t2=std::move(t1); 7/2 
ti=std::thread(some_other_function); // 3 

std::thread t3; // 4 

t3=std: :move(t2); // 5 

ti=std: :move(t3); // 6 赋值 操作 将 使 程序 崩溃 


当 显 式 使 用 std: :move() 创建 t2 后 @ ° t1 的 所 有 权 就 转移 给 了 t2。 之 后 ，t1 和 执行 线程 已 经 没 
有 关联 了 ; 执行 some_function 的 函数 现在 与 t2 关 联 。 


然后 ， 与 一 个 临时 std::thread 对 象 相 关 的 线程 启动 了 @。 为 什么 不 显 式 调用 std: :move() 转 
移 所 有 权 呢 ? 因为 ， 所 有 者 是 一 个 临时 对 象 一 一 移动 操作 将 会 隐 式 的 调用 。 


t3 使 用 默认 构造 方式 创建 @@， 与 任何 执行 线程 都 没有 关联 。 调 用 std::move() 将 与 纪 关 联 线程 
Ay PY Ay AR Fe AS B13 FO 2 因为 t2 是 一 个 命名 对 象 ， 需要 显 式 的 调用 std::move() ° 移动 操作 加 
完成 后 ，t1 与 执行 Some_other function 的 线程 相关 联 ，t2 与 任何 线程 都 无 关联 ，t3 与 执行 
some_function 的 线程 相关 联 。 


最 后 一 个 移动 操作 ， 将 some_function 线 程 的 所 有 权 和 转移 @ 给 t1。 不 过 ，t1 已 经 有 了 一 个 关联 
的 线程 (执行 Some_other_function 的 线程 )， 所 以 这 里 系统 直接 调用 std::terminate() 终止 程 
序 继续 运行 。 这 样 做 (不 抛 出 异常 ” std::terminate() 7 noexcept Sh a) 7% A 了 保证 

与 std::thread 的 析 构 hy He AY AT A — BK ° 2.1.1 节 中 2 需要 在 线程 对 象 被 析 构 前 ? 显 式 的 等 待 
线程 完成 ， 或 者 分 离 它 ; 进行 赋值 时 也 需要 满足 这 些 条 件 ( 说 明 : 不 能 通过 赋 一 个 新 值 

给 std::thread 对 象 的 方式 来 "丢弃 "一 个 线程 ) 8 


std::thread 支持 移动 ， 就 意味 着 线程 的 所 有 权 可 以 在 函数 外 进行 转移 ， 就 如 下 面 程 序 一 样 。 


清单 2.5 函数 返回 std::thread 对 象 


std::thread f() 
{ 
void some_function(); 
return std::thread(some_function); 


std::thread g() 
{ 


void some_other_function(int); 
std::thread t(some_other_function, 42); 
return t; 


当 所 有 权 可 以 在 函数 内 部 传递 2 就 允许 std::thread 实例 可 作为 参数 进行 传递 2 代码 如 下 : 


void f(std::thread t); 

void g() 

{ 
void some_function(); 
f(std::thread(some_function) ); 
std::thread t(some_function); 
f(std::move(t)); 


std::thread 支持 移动 的 好 处 是 可 以 创建 thread_guard 类 的 实例 (定义 见 清单 2.3)， 并 且 拥 有 

其 线程 的 所 有 权 。 当 thread_guard 对 象 所 持 有 的 线程 已 经 被 引用 ， 移 动 操作 就 可 以 避免 很 多 

不 必要 的 麻烦 ; 这 意味 着 ， 当 某 个 对 象 转移 了 线程 的 所 有 权 后 ， 它 就 不 能 对 线程 进行 加 入 或 

分 离 。 为 了 确保 线程 程序 退出 前 完成 ， 下 面 的 代码 里 定义 了 scoped thread 类 。 现 在， 我 们 来 
看 一 下 这 段 代码 : 


清单 2.6 scoped thread 的 用 法 


class scoped_thread 
{ 
std::thread t; 
public: 
explicit scoped_thread(std::thread t_): (pi So 
t(std::move(t_)) 


if(!t.joinable() ) ig 2 
throw std::logic_error(“No thread”); 


} 
~Scoped_ thread ( ) 


{ 
t.join(); // 3 
} 
scoped_thread(scoped_thread const&)=delete; 
scoped_thread& operator=(scoped_thread const&)=delete; 


ti 
struct func; // 定义 在 清单 2 ,1 中 


void f() 
{ 
int some_local_state; 
scoped_thread t(std::thread(func(some_local_state))); // 4 


do_something_in_current_thread(); 
} 人 5 


与 清单 2.3 相 似 ， 不 过 这 里 新 线程 是 直接 传递 到 Scoped _ thread 中国， 而 非 创建 一 个 独立 的 命名 

量 。 当 主线 程 到 达 f) 函 数 的 末尾 时 ，scoped thread 对 象 将 会 销毁 ， 然 后 加 入 四 到 的 构造 也 
数 @ 创 建 的 线程 对 象 中 去 。 而 在 清单 2.3 中 的 thread_ guard 类 ， 就 要 在 析 构 的 时 候 检查 线程 是 
否 " 可 加 入 "。 这 里 把 检查 放 在 了 构造 函数 中 加 ， 并 且 当 线程 不 可 加 入 时 ， 抛 出 异常 。 


std::thread 对 象 的 容器 ， 如 果 这 个 容器 是 移动 敏感 的 (比如 ， > 标准 中 的 std::vector<> )? AR 
么 移动 操作 同样 适用 于 这 些 容器 。 了 解 这 些 后 ， 就 可 以 写 出 类 似 清单 2.7 中 的 代码 ， 代 码 量 产 
了 一 些 线程 ， 并 且 等 待 它们 结束 。 


清单 2.7 量 产 线程 ， 等 待 它们 结 


void do_work(unsigned id); 


void f() 
{ 
std::vector<std::thread> threads; 
for(unsigned i=0; i < 20; ++i) 
{ 
threads.push_back(std::thread(do_work,i)); // 产生 线程 
} 
std::for_each(threads.begin(),threads.end(), 
std::mem_fn(&std::thread::join)); // 对 每 个 线程 
调用 join() 
} 


我 们 经 常 需要 线程 去 分 割 一 个 算法 的 总 工作 量 ， 所 以 在 算法 结束 的 之 前 ， 所 有 的 线程 必须 结 
束 。 清 单 2.7 说 明 线 程 所 做 的 工作 都 是 独立 的 ， 并 且 结 果 仅 会 受到 共享 数据 的 影响 。 如 果 f() 有 
返回 值 ， 这 个 返回 值 就 依赖 于 线程 得 到 的 结果 。 在 写 入 返回 值 之 前 ， 程 序 会 检查 使 用 共享 数 
据 的 线程 是 否 终止 。 操 作 结 果 在 不 同 线程 中 转移 的 替代 方案 ， 我 们 会 在 第 4 章 中 再 次 讨论 。 


As 
ay 


td::thread 2A std::vector HMAEA MILES Pwr AW : 并 非 为 这 些 线程 创建 独 
立 的 变量 ， 并 且 将 他 们 直接 加 入 ， 可 以 把 它们 当做 一 个 组 。 创 E 运行 ee 
定 )， 可 使 得 这 一 步 迈 的 更 大 ， 而 非 像 清单 2.7 那 样 创 建国 定数 量 的 线程 。 


2.4 运行 时 决定 线程 数量 


std::thread: :hardware_concurrency() 在 新 版 C++ 标准 库 中 是 一 个 很 有 用 的 函数 。 这 个 函数 将 
返回 能 同时 并 发 在 一 个 程序 中 的 线程 数量 。 例 如 ， 多 核 系统 中 ， 返 回 值 可 以 是 CPU 核 芯 的 数 


量 。 返 回 值 也 仅仅 是 一 个 提示 ， 当 系统 信息 无 法 获取 时 ， 函 数 也 会 返回 0。 但 是 ， 这 也 无 法 掩 
盖 这 个 函数 对 局 动 线程 数量 的 帮助 。 


清单 2.8 实 现 了 一 个 并 行 版 的 std::accumulate 。 代 码 中 将 整体 工作 拆 分 成 小 任务 交 给 每 个 线 
程 去 做 ， 其 中 设置 最 小 任务 数 ， 是 为 了 避免 产生 太 多 的 线程 。 程 序 可 能 会 在 操作 数量 为 0 的 时 
候 抛 出 异常 ° Hike > std::thread 构造 函数 无 法 启动 一 个 执行 线程 ， 就 会 抛 出 一 个 异常 。 在 这 
个 算法 中 讨论 异常 处 理 ， 已 经 超出 现 阶 段 的 讨论 范围 ， 这 个 问题 我 们 将 在 第 8 章 中 再 来 讨论 。 


清单 2.8 原生 并 行 版 的 std::accumulate 


template<typename Iterator,typename T> 
struct accumulate_block 
{ 
void operator()(Iterator first,Iterator last,T& result) 
{ 
result=std::accumulate(first, last, result); 
} 
}; 


template<typename Iterator,typename T> 
T parallel_accumulate(Iterator first,Iterator last,T init) 


{ 


unsigned long const length=std::distance(first, last); 


if(!length) // 1 
return init; 


unsigned long const min_per_thread=25; 
unsigned long const max_threads= 


(Length+min_per_thread-1)/min_per_thread; // 2 


unsigned long const hardware_threads= 
std::thread: :hardware_concurrency(); 


unsigned long const num_threads= // 3 


std::min(hardware_threads != 0 ? hardware _ threads : 2, 
max_threads); 


unsigned long const block_size=length/num_threads; // 4 


std::vector<T> results(num_threads); 
std::vector<std::thread> threads(num_threads-1); // 5 


Iterator block_start=first; 
for(unsigned long i=0; i < (num_threads-1); ++i) 
{ 
Iterator block_end=block_start; 
std: :advance(block_end,block_size); // 6 
threads[i]=std::thread( LU U 
accumulate_block<Iterator,T>(), 
block_start, block_end,std::ref(results[i])); 
block_start=block_end; // 8 
} 
accumulate_block<Iterator, T>() ( 
block_start, last, results[num_threads-1]); // 9 
std::for_each(threads.begin(), threads.end(), 
std::mem_fn(&std::thread::join)); // 10 


return std::accumulate(results.begin(),results.end(),init); // 
11 


} 


函数 看 起 来 很 长 ， 但 不 复杂 。 如 果 输 入 的 范围 为 空中 ， 就 会 得 到 init 的 值 。 反 之 ， 如 果 范 围 内 
多 于 一 个 元 素 时 ， 都 需要 用 范围 内 元 素 的 总 数量 除 以 线程 ( 块 ) 中 最 小 任务 数 ， 从 而 确定 启动 线 
程 的 最 大 数量 加 ， 这 样 能 避免 无 谓 的 计算 资源 的 浪费 。 比 如 ， 一 台 32 芯 的 机 器 上 ， 只 有 5 个 数 
需要 计算 ， 却 启动 了 32 个 线程 。 


计算 量 的 最 大 值 和 硬件 支持 线程 数 中 ， 较 小 的 值 为 启动 线程 的 数量 回 。 因 为 上 下 文 频繁 的 切换 
会 降低 线程 的 性 能 ， 所 以 你 肯定 不 想 启 动 的 线程 数 多 于 硬件 支持 的 线程 数量 。 

当 std::thread: :hardware_concurrency() 返回 0， 你 可 以 选择 一 个 合适 的 数 作为 你 的 选择 ; 在 
本 例 中 ,我 选择 了 "2"。 你 也 不 想 在 一 台 单 核 机 器 上 局 动 太 多 的 线程 ， 因 为 这 样 反 而 会 降低 性 
能 ， 有 可 能 最 终 让 你 放弃 使 用 并 发 。 


每 个 线程 中 处 理 的 元 素数 量 ,是 范围 中 元 素 的 总 量 除 以 线程 的 个 数 得 出 的 @。 对 于 分 配 是 否 得 
当 ， 我 们 会 在 后 面 讨论 。 


现在 ， 确 定 了 线程 个 数 ， 通 过 创建 一 个 std::vector<T> 容器 存放 中 间 结 果 ， 并 为 线程 创建 一 
个 std::vector<std::thread> 容器 @@。 这 里 需要 注意 的 是 ， 启 动 的 线程 数 必须 比 num_threads 
少 1 个 ， 因 为 在 启动 之 前 已 经 有 了 一 个 线程 (主线 程 )。 


使 用 简单 的 循环 来 启动 线程 : block_end 迭 代 器 指向 当前 块 的 末尾 @， 并 启动 一 个 新 线程 为 当 
前 块 累 加 结果 @。 当 和 迭代 器 指向 当前 块 的 末尾 时 ， 居 动 下 一 个 块 回 。 


aA ies? @ 中 的 线程 会 处 理 最 终 块 的 结果 。 对 于 分 配 不 均 ， 因 为 知道 最 终 块 是 哪 一 
个 ， 那 么 这 个 块 中 有 多 少 个 元 素 就 无 所 谓 了 。 


当 累 加 最 终 块 的 结果 后 ， 可 以 等 待 std::for_each 四 创建 线程 的 完成 (如 同 在 清单 2.7 中 做 的 那 
样 )， 之 后 使 用 std::accumulate 将 所 有 结果 进行 累加 (站 。 


结束 这 个 例子 之 前 ， 需 要 明确 : TT 类 型 的 加 法 运算 不 满足 结合 律 (比如 ， 对 于 float 型 或 double 
型 ， 在 进行 加 法 操作 时 ， 系 统 很 可 能 会 做 截断 操作 )， 因 为 对 范围 中 元 素 的 分 组 ， 会 导致 
ev eae 的 结果 可 能 与 std::accumulate 得 到 的 结果 不 同 。 同 样 的 ， 这 里 对 迁 

RA 器 的 要 求 更 加 严格 : : 必须 都 是 向 前 迭代 器 ， 而 std::accumulate PVE RAR ER 89 情 JL 
e 。 对 于 创建 出 results 容 器 ， 需 要 保证 T 有 默认 构造 函数 。 对 于 算法 并 行 ， 通 常 都 要 这 样 
的 修改 ; 不 过 ， 需 要 根据 算法 本 身 的 特性 ， 选 择 不同 的 并 行 方式 。 算 法 并 行 会 在 第 8 章 有 更 加 
深入 的 讨论 。 需 要 注意 的 : 因为 不 能 直接 从 一 个 线程 中 返回 一 个 值 ， 所 以 需要 传递 results 容 
器 的 引用 到 线程 中 去 。 另 一 个 办 法 ， 通 过 地 址 来 获取 线程 执行 的 结果 ; 第 4 章 中 ， 我 们 将 使 用 
期 望 (futures) 完 成 这 种 方案 。 


当 线 程 运行 时 ， 所 有 必要 的 信息 都 需要 传 入 到 线程 中 去 ， 包 括 存储 计算 结果 的 位 置 。 不 过 ， 

并 非 总 需 如 此 : 有 时 候 这 是 识别 线程 的 可 行 方案 ， 可 以 传递 一 个 标识 数 ， 例 如 清单 2.7 中 的 i。 
不 过 ， 当 需要 标识 的 函数 在 调用 栈 的 深层 ， 同 时 其 他 线程 也 可 调用 该 函数 ， 那 么 标识 数 就 会 

变 的 捉襟见肘 。 好 消息 是 在 设计 C++ 的 线程 库 时 ， 就 有 预见 了 这 种 情况 ， 在 之 后 的 实现 中 就 给 
每 个 线程 附加 了 唯一 标识 符 。 


2.5 识别 线程 


线程 标识 类 型 是 std::thread::id ， 可 以 通过 两 种 方式 进行 检索 。 第 一 种 ， 可 以 通过 调 

用 std::thread 4 RA mA BHA get_id() 来 直接 获取 。 如 果 std::thread 对 象 没 有 
行 线程 相关 联 ，get_id() 将 返回 std::thread::type 默认 构造 值 ， 这 个 值 表示 “没有 线程 ”。 

二 种 ， 当 前 线程 中 调用 std::this_thread: :get_id() (这 个 函数 定义 在 <thread> 头 文件 中 ) 也 

以 获得 线程 标识 。 


std::thread::id 对 象 可 以 自由 的 找 贝 和 对 比 ,因为 标识 符 就 可 以 复 用 。 如 果 两 个 对 饮 
的 std::thread::id 相等 ， 那 它们 就 是 同一 个 线程 ， 或 者 都 “没有 线程 ”。 如 果 不 等 ， 那 么 就 代 
表 了 两 个 不 同 线程 ， 或 者 一 个 有 线程 ， 另 一 没有 。 


线程 库 不 会 限制 你 去 检查 线程 标识 是 否 一 样 ， std::thread::id 类 型 对 象 提 供 相 当 丰 富 的 对 比 
操作 ; 比如 ， 提 供 为 不 同 的 值 进行 排序 。 这 意味 着 Ee: 员 a 其 当做 为 容器 的 键 值 ， 做 排 
序 ， 或 做 其 他 方式 的 比较 。 按 默认 顺序 比较 不 同 值 的 std::thread::id ， 所 以 这 个 行为 可 预见 
的 : 当 a<b，b<c 时 ， 得 a<c ， 等 等 。 标 准 库 也 提供 std::hash<std::thread::id> 容器 ， 所 
以 std::thread::id 也 可 以 作为 无 序 容 器 的 键 值 。 


std::thread::id 实例 常用 作 检 测 线程 是 否 需要 进行 一 些 操作 ， 比 如 : 当 用 线程 来 分 割 一 项 工 
作 ( 如 清单 2.8)， 主 线程 可 能 要 做 一 些 与 其 他 线程 不 同 的 工作 。 这 种 情况 下 ， 启 动 其 他 线程 

前 ， 它 可 以 将 自己 的 线程 ID 通过 std: :this_thread: :get_id() 得 到 ， 并 进行 存储 就 是 算法 核 
心 部 分 (所 有 线程 都 一 样 的 ), 每 个 线程 都 要 检查 一 下 ， 其 拥有 的 线程 ID 是 否 与 初始 线程 的 ID 相 
同 。 


std::thread::id master_thread; 
void some_core_part_of_algorithm( ) 





{ 
if(std::this_thread: :get_id( )==master_thread) 
{ 
do_master_thread_work(); 
} 
do_common_work(); 
} 


另外 ， 当前 线程 的 std::thread::id 将 存储 到 一 个 数据 os 。 之 后 在 这 个 结构 体 中 对 当 前 线 
程 的 ID 与 存储 的 线程 ID 做 对 比 ， 来 决定 操作 是 被 “允许 "， 还 是 “需要 "(permitted/required)。 


同样 ， 作 为 线程 和 本 地 存储 不 适 配 的 替代 方案 ， 线 程 ID 在 容器 中 可 作为 键 值 。 例 如 ， 容 器 可 
以 存储 其 掌控 下 每 个 线程 的 信息 ， 或 在 多 个 线程 中 互 传 信息 。 


std::thread::id 可 以 作为 一 个 线程 的 通用 标识 符 ， 当 标识 符 只 与 语义 相关 (比如 ， 数 组 的 索 
引 ) 时 ， 就 需要 这 个 方案 了 。 也 可 以 使 用 输出 流 ( std: :cout ) 来 记录 一 个 std::thread::id 对 象 
的 值 。 


std: :cout<<std::this_thread::get_id(); 


具体 的 输出 结果 是 严格 依赖 于 具体 实现 的 ，C++ 标 准 的 唯一 要 求 就 是 要 保证 ID 比较 结果 相等 的 
线程 ， 必 须 有 相同 的 输出 。 


2.6 AER 


本 章 讨论 了 C++ 标准 库 中 基本 的 线程 管理 方式 : 启动 线程 ， 等 待 结束 和 不 等 待 结束 (因为 需要 
它们 运行 在 后 台 )。 并 了 解 应 该 如 何在 线程 启动 前 ， 向 线程 函数 中 传递 参数 ， 如 何 转移 线程 的 
所 有 权 ， 如 何 使 用 线程 组 来 分 割 任务 。 最 后 ， 讨 论 了 使 用 线程 标识 来 确定 关联 数据 ， 以 及 特 

珠 线程 的 特殊 解决 方案 。 虽 然 ， 现 在 已 经 可 以 纯粹 的 依赖 线程 ， 使 用 独立 的 数据 ， 做 独立 的 

任务 (如 同 清单 2.8)， 但 在 某 些 情况 下 ， 线 程 确实 需要 有 共享 数据 。 第 3 章 会 讨论 共享 数据 和 线 
程 的 直接 关系 。 第 4 章 会 讨论 在 (有 /没有 ) 共 享 数 据 情况 下 的 线程 同步 操作 。 


第 3 章 线程 间 共 享 数据 


本 章 主要 内 容 


e 共享 数据 带 来 的 问题 
。 使 用 互 不 量 保 护 数据 
© 数据 保护 的 替代 方案 


上 一 章 中 ， 我 们 已 经 对 线程 管理 有 所 了 解 了 ， 现 在 让 我 们 来 看 一 下 "共享 数据 的 那些 事 "。 


想象 一 下 ， 你 和 你 的 朋友 合租 一 个 公寓 ， 公 寓 中 只 有 一 个 司 房 和 一 个 卫生 间 。 当 你 的 朋友 在 
卫生 间 时 ， 你 就 会 不 能 使 用 了 (除非 你 们 特别 好 ， 好 到 可 以 在 同时 使 用 一 个 房间 )。 这 个 问题 也 
会 出 现在 司 房 ， 假 如 :厨房 里 有 一 个 组 合式 烤箱 ， 当 在 烧香 肠 的 时 候 ， 也 在 做 蛋糕 ， 就 可 能 得 
到 我 们 不 想 要 的 食物 (香肠 味 的 蛋糕 )。 此 外 ， 在 公共 空间 将 一 件 事 做 到 一 半 时 ， 发 现 某 些 需要 
的 东西 被 别人 借 走 ， 或 是 当 离 开 的 一 段 时 间 内 有 些 东 西 被 变动 了 地 方 ， 这 都 会 令 我 们 不 粒 。 


同样 的 问题 ， 也 困扰 着 线程 。 当 线程 在 访问 共享 数据 的 时 候 ， 必 须 定 一 些 规矩， 用 来 限定 线 
程 可 访问 的 数据 位 。 还 有 ， 一 个 线程 更 新 了 共享 数据 ， 需 要 对 其 他 线程 进行 通知 。 从 易 用 性 
的 角度 ， 同 一 进程 中 的 多 个 线程 进行 数据 共享 ， 有 利 有 拳 。 错 误 的 共享 数据 使 用 是 产生 并 发 
bug 的 一 个 主要 原因 ， 并 且 后 果 要 比 香 肠 味 的 蛋糕 更 加 严重 。 


本 章 就 以 在 C++ 中 进行 安全 的 数据 共享 为 主题 。 避 免 上 述 及 其 他 潜在 问题 的 发 生 的 同时 ， 将 共 
享 数据 的 优势 发 挥 到 最 大 。 


3.1 共享 数据 带 来 的 问题 


当 涉 及 到 共享 数据 时 ， 问 题 很 可 能 是 因为 共享 数据 修改 所 导致 。 如 果 共 享 数 据 是 只 读 的 ， 那 
么 只 读 操作 不 会 影响 到 数据 ， 更 不 会 涉及 对 数据 的 修改 ， 所 以 所 有 线程 都 会 获得 同样 的 数 
据 。 但 是 ， 当 一 个 或 多 个 线程 要 修改 共享 数据 时 ， 就 会 产生 很 多 麻烦 。 这 种 情况 下 ， 就 必须 
小 心 谨 惯 ， 才 能 确保 一 切 所 有 线程 都 工作 正常 。 





不 变量 (invariants) 的 概念 对 程序 员 们 编写 的 程序 会 有 一 定 的 帮助 一 “对 于 特殊 结构 体 的 描 
述 ; 比如 ， "变量 包含 列表 中 的 项 数 "。 不 变量 通常 会 在 一 次 更 新 中 被 破坏 ， 特 别 是 比较 复杂 的 
数据 结构 ， 或 者 一 次 更 新 就 要 改动 很 大 的 数据 结构 。 


双 链 表 中 每 个 节点 都 有 一 个 指针 指向 列表 中 下 一 个 节点 ， 还 有 一 个 指针 指向 前 一 个 节点 。 其 
中 不 变量 就 是 节点 A 中 指向 “下 一 个 "节点 B 的 指针 ， 还 有 前 向 指针 。 为 了 从 列表 中 删除 一 个 节 
点 ， 其 两 边 节 点 的 指针 都 需要 更 新 。 当 其 中 一 边 更 新 完成 时 ， 不 变量 就 被 破坏 了 ， 直 到 另 一 
边 也 完成 更 新 ; 在 两 边 都 完成 更 新 后 ， 不 变量 就 又 稳定 了 。 
从 一 个 列表 中 删除 一 个 节点 的 步骤 如 下 (如 图 3.1) 

1. 找到 要 删除 的 节点 N 

2. 更 新 前 一 个 节点 指向 N 的 指针 ， 让 这 个 指针 指向 N 的 下 一 个 节点 

3. 更 新 后 一 个 节点 指向 N 的 指针 ， 让 这 个 指正 指向 N 的 前 一 个 节点 

4. 删除 节点 N 


eo | Fe | Fe | 
.———— | 

——— | a 

c) 

d) 





图 3.1 从 一 个 双 链表 中 删除 一 个 节点 
图 中 b 和 c 在 相同 的 方向 上 指向 和 原来 已 经 不 一 致 了 ， 这 就 破坏 了 不 变量 。 


线程 问 潜在 问题 就 是 修改 共享 数据 ， 致 使 不 变量 遭 到 破坏 。 当 不 做 些 事 来 确保 在 这 个 过 程 中 
不 会 有 其 他 线程 进行 访问 的 话 ， 可 能 就 有 线程 访问 到 刚刚 删除 一 边 的 节点 ; 这 样 的 话 ， 线 程 
就 读 取 到 要 删除 节点 的 数据 (因为 只 有 一 边 的 连接 被 修改 ， 如 图 3.1(b))， 所 以 不 变量 就 被 破 
坏 。 破 坏 不 变量 的 后 果 是 多 样 ， 当 其 他 线程 按 从 左 往 右 的 顺序 来 访问 列表 时 ， 它 将 跳 过 被 册 
除 的 节点 。 在 一 方面 ， 如 有 第 二 个 线程 党 试 删除 图 中 右边 的 节点 ， 那 么 可 能 会 让 数据 结构 产 
生 永久 性 的 损坏 ， 使 程序 崩溃 。 无 论 结果 如 何 ， 都 是 并 行 代码 常见 错误 : 条 件 竞争 。 


3.1.1 条 件 竞争 


假设 你 去 电影 院 买 电影 票 。 如 果 去 的 是 一 家 大 电影 院 ， 有 很 多 收银 台 ， 很 多 人 就 可 以 在 同一 
时 间 买 电影 票 。 当 另 一 个 收银 台 也 在 卖 你 想 看 的 这 场 电影 的 电影 票 ， 那 么 你 的 座位 选择 范围 
就 取决 于 在 之 前 已 预定 的 座位 。 当 只 有 少量 的 座位 剩 下 ， 这 就 意味 着 ， 这 可 能 是 一 场 抢 票 比 
赛 ， 看 谁 能 抢 到 最 后 一 张 票 。 这 就 是 一 个 条 件 竞争 的 例子 ; 你 的 座位 (或 者 你 的 电影 票 ) 都 取决 
于 两 种 购买 方式 的 相对 顺序 。 


并 发 中 竞争 条 件 的 有 形成， 取决 于 一 个 以 上 线程 的 相对 执行 顺序 ， 每 个 线程 都 抢 着 完成 自己 的 
任务 。 大 多 数 情况 下 ， 即 使 改变 执行 顺序 ， 也 是 良性 竞争 ， 其 结果 可 以 接受 。 例 如 ， 有 两 个 
线程 同时 向 一 个 处 理 队列 中 添加 任务 ， 因 为 系统 提供 的 不 变量 保持 不 变 ， 所 以 谁 先 谁 后 都 不 
会 有 什么 影响 。 当 不 变量 遭 到 破坏 时 ， 才 会 产生 条 件 竞 争 ， 比 如 双向 链表 的 例子 。 并 发 中 对 
数据 的 条 件 竞 争 通常 表示 为 恶性 条 件 竞 争 ， 我 们 对 不 产生 问题 的 良性 条 件 竞 争 不 感 兴 

趣 。 c++ 标准 中 也 定义 了 数据 竞争 这 个 术语 ， 一 种 特殊 的 条 件 竞争 : 并 发 的 去 修改 一 个 独立 
对 象 (参见 5.1.2 节 )， 数 据 竞 争 是 (可 怕 的 ) 未 定义 行为 的 起 因 。 


恶性 条 件 竞争 通常 发 生 于 完成 对 多 于 一 个 的 数据 块 的 修改 时 ， 例 如 ， 对 两 个 连接 指针 的 修改 
(如 图 3.1)。 因 为 操作 要 访问 两 个 独立 的 数据 块 ， 独 立 的 指令 将 会 对 数据 块 将 进行 修改 ， 并 且 
其 中 一 个 线程 可 能 正在 进行 时 ， 另 一 个 线程 就 对 数据 块 进行 了 访问 。 因 为 出 现 的 概率 太 低 ， 
条 件 竞 争 很 难 查找 ， 也 很 难 复 现 。 如 CPU 指令 连续 修改 完成 后 ， 即 使 数据 结构 可 以 让 其 他 并 
发 线程 访问 ， 问 题 再 次 复 现 的 几率 也 相当 低 。 当 系统 负载 增加 时 ， 随 着 执行 数量 的 增加 ， 执 
行 序列 的 问题 复 现 的 概率 也 在 增加 ， 这 样 的 问题 只 可 能 会 出 现在 负载 比较 大 的 情况 下 。 条 件 
竞争 通常 是 时 间 敏 感 的 ， 所 以 程序 以 调试 模式 运行 时 ， 它 们 常会 完全 消失 ， 因 为 调试 模式 会 
影响 程序 的 执行 时 间 ( 即 使 影响 不 多 ) 。 


当 你 以 写 多 线程 程序 为 生 ， 条 件 竞 争 就 会 成 为 你 的 梦 厦 ; 编写 软件 时 ， 我 们 会 使 用 大 量 复杂 
的 操作 ， 用 来 避免 恶性 条 件 竞争 。 


3.1.2 避免 恶性 条 件 竞 争 


这 里 提供 一 些 方法 来 解决 恶性 条 件 竞争 ， 最 简单 的 办 法 就 是 对 数据 结构 采用 某 种 保护 机 制 ， 
确保 只 有 进行 修改 的 线程 才能 看 到 不 变量 被 破坏 时 的 中 间 状 态 。 从 其 他 访问 线程 的 角度 来 
看 ， 修 改 不 是 已 经 完成 了 ， 就 是 还 没 开 始 。 c++ 标准 库 提 供 很 多 类 似 的 机 制 ， 下 面 会 逐一 介 


绍 。 


另 一 个 选择 是 对 数据 结构 和 不 变量 的 设计 进行 修改 ， 修 改 完 的 结构 必须 能 完成 一 系列 不 可 分 
割 的 变化 ， 也 就 是 保证 每 个 不 变量 保持 稳定 的 状态 ， 这 就 是 所 谓 的 无 锁 编 程 。 不 过 ， 这 种 方 
式 很 难得 到 正确 的 结果 。 如 果 到 这 个 级 别 ， 无 论 是 内 存 模型 上 的 细微 差异 ， 还 是 线程 访问 数 
据 的 能 力 ， 都 会 让 工作 变 的 复杂 。 内 存 模 型 将 在 第 5 章 讨论 ， 无 锁 编程 将 在 第 7 章 讨论 。 


另 一 种 处 理 条 件 竞 争 的 方式 是 ， 使 用 事务 的 方式 去 处 理 数据 结构 的 更 新 (这 里 的 "处 理 " 就 如 同 
对 数据 库 进 行 更 新 一 样 )。 所 需 的 一 些 数据 和 读 取 都 存储 在 事务 日 志 中 ， 然 后 将 之 前 的 操作 合 
为 一 步 ， 再 进行 提交 。 当 数据 结构 被 另 一 个 线程 修改 后 ， 或 处 理 已 经 重启 的 情况 下 ， 提 交 就 
会 无 法 进行 ， oe nan 。 理论 研究 中 ， We 领域 。 这 个 概念 
将 不 会 在 本 书 中 再 进行 介绍 ， 因 为 在 ct+ 中 没有 对 STM 进行 直接 支持 。 但 是 ， 基 本 思想 会 在 
后 面 提 及 。 


保护 共享 数据 结构 的 最 基本 的 方式 ， 是 使 用 C++ 标准 库 提 供 的 互 太 量 。 


3.2 使 用 互 不 量 保 护 共 序数 据 


当 程序 中 有 共享 数据 ， 肯 定 不 想 让 其 陷入 条 件 竞争 ， 或 是 不 变量 被 破坏 。 那 么 ， 将 所 有 访问 
共享 数据 结构 的 代码 都 标记 为 互 斥 岂 不 是 更 好 ? 这 样 任何 一 个 线程 在 执行 这 些 代码 时 ， 其 他 
任何 线程 试图 访问 共享 数据 结构 ， 就 必须 等 到 那 一 段 代码 执行 结束 。 于 是 ， 一 个 线程 就 不 可 
能 会 看 到 被 破坏 的 不 变量 ， 除 非 它 本 身 就 是 修改 共享 数据 的 线程 。 


当 访 问 共享 数据 前 ， 使 用 互 斥 量 将 相关 数据 锁 住 ， 再 当 访 问 结束 后 ， 再 将 数据 解锁 。 线 程 库 
需要 保证 ， 当 一 个 线程 使 用 特定 互 斥 量 锁 eet PAE 要 访问 锁 住 的 数据 ， 
都 必须 等 到 之 前 那个 线程 对 数据 进行 解锁 后 ， 才 能 进行 访问 。 这 就 保证 了 所 有 线程 能 看 到 共 
享 数 据 ， 而 不 破坏 不 变量 


BER c++ 中 一 种 最 通用 的 数据 保护 机 制 ， 但 它 不 是 “ 银 弹 ”; 精心 组 织 代码 来 保护 正确 的 数 
据 ( 见 3.2.2 节 )， 并 在 接口 内 部 避 重要 的 。 但 互 矿 量 自身 也 有 问 
题 ， 也 会 造成 死 锁 ( 见 3.2.4 节 )， 或 是 对 数据 保护 的 太 多 (或 太 少 )( 见 3.2.8 节 )。 


3.2.1 C++ 中 使 用 互 不 量 


C++ 中 通过 实例 化 std: :mutex 创建 互 斥 量 ， 通 过 调用 成 员 有 函数 lock() 进 行 上 锁 ，unlock() 进 
解锁 。 不 过 ， 不 推荐 实践 中 直接 去 调用 成 员 汐 数 ， 因 为 调用 成 员 哆 数 就 意味 着 ， oe 
每 个 函数 出 口 都 要 去 调用 unlock()， 也 包括 异常 的 情况 。C++ 标 准 库 为 互 斥 量 提 供 了 一 个 RAII 
语法 的 模板 类 std::lock_guard ， 其 会 在 构造 的 时 候 提 供 已 锁 的 互 斥 量 ， 并 在 析 构 的 时 候 进行 
解锁 ， 从 而 保证 了 一 个 已 锁 的 互 斥 量 总 是 会 被 正确 的 解锁 。 下 面 的 程序 清单 中 ， 展 示 了 如 何 
在 多 线程 程序 中 ， 使 用 std::mutex 构造 的 std::lock _guard 实例 ， 对 一 个 列表 进行 访问 保 

护 。 std::mutex 和 std: :lock_guard 都 在 <mutex> 头 文 件 中 声 AF] o 


清单 3.1 使 用 互 斥 量 保护 列表 


#include <list> 
#include <mutex> 
#include <algorithm> 


std::list<int> some_list; f/f. 
std: :mutex some_mutex; 人 2 


void add_to_list(int new_value) 


{ 
std::lock_guard<std: :mutex> guard(some_mutex); // 3 
some_list.push_back(new_value); 

} 

bool list_contains(int value_to_find) 

{ 
std::lock_guard<std: :mutex> guard(some_mutex); // 4 
return 


std::find(some_list.begin(),some_list.end(),value_to_find) != 
some_list.end(); 


} 


清单 3.1 中 有 一 个 全 局 变量 @， 这 个 全 局 变量 被 一 个 全 局 的 互 斥 量 保护 @ 。add to list0@ 和 
list_contains()@ 44 P 1% Ħ] std::lock_guard<std::mutex> ， 使 得 这 两 个 函数 中 对 数据 的 访问 
是 互 太 的 : list_contains() 不 可 能 看 到 正在 被 add to list() 修 改 的 列表 。 


虽然 某 些 情况 下 ， 使 用 全 局 变量 没 问 题 ， 但 在 大 多 数 情况 下 ， 互 矿 量 通常 会 与 保护 的 数据 放 
在 同一 个 类 中 ， 而 不 是 定义 成 全 局 变量 。 这 是 面向 对 象 设 计 的 准则 : 将 其 放 在 一 个 类 中 ， 就 
可 让 他 们 联系 在 一 起 ， 也 可 对 类 的 功能 进行 封装 ， 并 进行 数据 保护 。 在 这 种 情况 下 ， 函 数 
add_to_list#-list_contains T Ase ARPA RR BH oe AF SARA HRB? LAPP 
要 定义 为 private 成 员 ， 这 会 让 访问 数据 的 代码 变 的 清晰 ， 并 且 容 易 看 出 在 什么 时 候 对 互 斤 量 
上 人 锁 。 当 所 有 成 员 有 函数 都 会 在 调用 时 对 数据 上 锁 ， 结 束 时 对 数据 解锁 ， 那 么 就 保证 了 数据 访 
问 时 不 变量 不 被 破坏 。 


当然 ， 也 不 是 总 是 那么 理想 ， 聪 明 的 你 一 定 注 意 到 了 : SEP +R BRR ERP KR 
据 的 指针 或 引用 时 ， 会 破坏 对 数据 的 保护 。 具 有 访问 能 力 的 指针 或 引用 可 以 访问 (并 可 能 修改 ) 
被 保护 的 数据 ， 而 不 会 被 互 斤 锁 限 制 。 互 斤 量 保护 的 数据 需要 对 接口 的 设计 相当 说 惯 ， 要 确 
保 互 不 量 能 锁 住 任何 对 保护 数据 的 访问 ， 并 且 不 留 后 门 。 


3.2.2 精心 组 织 代码 来 保护 共享 数据 


使 用 BERR BE ? 并 不 是 仅仅 在 每 一 个 成 员 函数 中 都 加 入 一 个 std: :lock_guard xt HR Ap 
么 简单 ; 一 个 迷失 的 指针 或 引用 ， 将 会 让 这 种 保护 形同虚设 。 不 过 ， 检 查 迷 失 指 针 或 引用 是 
很 容易 的 ， 只 要 没有 成 员 函 数 通过 返回 值 或 者 输出 参数 的 形式 向 其 调用 者 返回 指向 受 保护 数 
据 的 指针 或 引用 ， 数 据 就 是 安全 的 。 如 果 你 还 想 往 祖 坟 上 创 ， 就 没 这 么 简单 了 。 在 确保 成 员 
函数 不 会 传 出 指针 或 引用 的 同时 ， 检 查 成 员 邓 数 是 否 通过 指针 或 引用 的 方式 来 调用 也 是 很 重 
要 的 (尤其 是 这 个 操作 不 在 你 的 控制 下 时 )。 函 数 可 能 没 在 互 斥 量 保护 的 区 域内 ， 存 储 着 指针 或 
者 引用 ， 这 样 就 很 危险 。 更 危险 的 是 : 将 保护 数据 作为 一 个 运行 时 参数 ， 如 同 下 面 清单 中 所 
示 那 样 。 


清单 3.2 无 意 中 传递 了 保护 数据 的 引用 


class some_data 


{ 

int a; 

std::string b; 
public: 

void do_something(); 
J; 
class data_wrapper 
{ 
private: 


some_data data; 
std::mutex m; 
public: 
template<typename Function> 
void process_data(Function func) 
{ 
std: :lock_guard<std: :mutex> 1(m); 
func(data); // 1 传递 “保护 ”数据 给 用 户 函 数 
} 
}; 


some_data* unprotected; 


void malicious_function(some_data& protected_data) 


{ 
unprotected=&protected_data; 
} 
data_wrapper x; 
void foo() 
{ 
x.process_data(malicious_function); // 2 传递 一 个 恶意 函数 


unprotected->do_something(); // 3 在 无 保护 的 情况 下 访问 保护 数据 


例子 中 process_data 看 起 来 没有 任何 问题 ， std::lock_guard 对 数据 做 了 很 好 的 保护 ， 但 调用 
用 户 提 供 的 函数 func@ ， 就 意味 着 foo 能 够 绕 过 保护 机 制 将 函数 malicious_function 传递 进去 
@， 在 没有 锁定 互 斥 量 的 情况 下 调用 do_something() ° 


这 段 代码 的 问题 在 于 根本 没有 保护 ， 只 是 将 所 有 可 访问 的 数据 结构 代码 标记 为 互 矿 。 函 

数 foo() 中 调用 unprotected->do_something() 的 代码 未 能 被 标记 为 互 斥 。 这 种 情况 下 ， 

C++ 线程 库 无 法 提供 任何 帮助 ， 只 能 由 程序 员 来 使 用 正确 的 互 斥 锁 来 保护 数据 。 从 乐观 的 角度 
上 看 ， 还 是 有 方法 可 循 的 : 切 勿 将 受 保护 数据 的 指针 或 引用 传递 到 互 斥 锁 作 用 域 之 外 ， 无 论 
是 函数 返回 值 ， 还 是 存储 在 外 部 可 见 内 存 ， 亦 或 是 以 参数 的 形式 传递 到 用 户 提供 的 函数 中 

去 。 


虽然 这 是 在 使 用 互 斥 量 保护 共享 数据 时 常 犯 的 错误 ， 但 绝 不 仅仅 是 一 个 潜在 的 陷阱 而 已 。 下 
一 节 中 ， 你 将 会 看 到 ， 即 便 是 使 用 了 互 斥 量 对 数据 进行 了 保护 ， 条 件 竞 争 依 昌 可 能 存在 。 


3.2.3 发 现 接口 内 在 的 条 件 竞 争 


因为 使 用 了 互 斤 量 或 其 他 机 制 保护 了 共享 数据 ， 就 不 必 再 为 条 件 竞 争 所 担忧 吗 ? 并 不 是 ， 你 
依旧 需要 确定 数据 受到 了 保护 。 回 想 之 前 双 链 表 的 例子 ， 为 了 能 让 线程 安全 地 删除 一 个 节 
点 ， 需 要 确保 防止 对 这 三 个 节点 ( 待 删除 的 节点 及 其 前 后 相 邻 的 节点 ) 的 并 发 访问 。 如 果 只 对 指 
向 每 个 节点 的 指针 进行 访问 保护 ， 屠 就 和 没有 使 用 互 斥 量 一 样 ， 条 件 竞 争 仍 会 发 生 一 一 除了 
指针 ， 整 个 数据 结构 和 整个 删除 操作 需要 保护 。 这 种 情况 下 最 简单 的 解决 方案 就 是 使 用 互 斥 
量 来 保护 整个 链表 ， 如 清单 3.1 所 示 。 


尽管 链表 的 个 别 操作 是 安全 的 ， 但 不 意味 着 你 就 能 走出 困境 ; 即使 在 一 个 很 简单 的 接口 中 ， 
依 昌 可 能 遇 到 条 件 竞 争 。 例 如 ， 构 建 一 个 类 似 于 std::stack 结构 的 栈 (清单 3.3) ， 除了 构造 函 
数 和 swap() 以 外 ， 需 要 对 std::stack 提供 五 个 操作 : push() 一 个 新 元 素 进 栈 ，pop() 一 个 元 素 
出 栈 ，top() 查 看 栈 顶 元 素 ，empty() 判 断 栈 是 否 是 空 栈 ，size() 了 解 栈 中 有 多 少 个 元 素 。 即 使 修 
改 了 top()， 使 其 返回 一 个 拷贝 而 非 引 用 ( 即 遵 特 了 3.2.2 节 的 准则 )， 对 内 部 数据 使 用 一 个 互 斥 
量 进行 保护 ， 不 过 这 个 接口 仍 存在 条 件 竞 争 。 这 个 问题 不 仅 存 在 于 基于 互 斥 量 实现 的 接口 

中 ， 在 无 锁 实 现 的 接口 中 ， 条 件 竞 争 依旧 会 产生 。 这 是 接口 的 问题 ， 与 其 实现 方式 无 关 。 


清单 3.3 std::stack 容器 的 实现 


template<typename T, typename Container=std: :deque<T> > 

class stack 

{ 

public: 
explicit stack(const Container&); 
explicit stack(Container&& = Container()); 
template <class Alloc> explicit stack(const Alloc&); 
template <class Alloc> stack(const Container&, const Alloc&); 
template <class Alloc> stack(Container&&, const Alloc&); 
template <class Alloc> stack(stack&&, const Alloc&); 


bool empty() const; 

size_t size() const; 

T& top(); 

T const& top() const; 

void push(T const&); 

void push(T&&); 

void pop(); 

void swap(stack&&) ; 
J; 


虽然 empty() 和 size() 可 能 在 被 调用 并 返回 时 是 正确 的 ， 但 其 的 结果 是 不 可 靠 的 ; 当 它 们 返回 
后 ， 其 他 线程 就 可 以 自由 地 访问 栈 ， 并 且 可 能 push() 多 个 新 元 素 到 栈 中 ， 也 可 能 pop() 一 些 已 
在 栈 中 的 元 素 。 这 样 的 话 ， 之 前 从 empty() 和 size() 得 到 的 结果 就 有 问题 了 。 


特别 地 ， 当 栈 实例 是 非 共享 的 ， 如 果 栈 非 室 ， 使 用 empty() 检 查 再 调用 top() 访 问 栈 顶部 的 元 素 
是 安全 的 。 如 下 代码 所 示 : 


stack<int> s; 

if (! s.empty()){ (a al 
int const value = s.top(); ij ee 
S.pop(); // 3 
do_something(value); 


以 上 是 单线 程 安全 代码 : 对 一 个 室 栈 使 用 top() 是 未 定义 行为 。 对 于 共享 的 栈 对 象 ， 这 样 的 调 
用 顺序 就 不 再 安全 了 ， 因 为 在 调用 empty()@ 和 调用 top()@ 之 间 ， 可 能 有 来 自 另 一 个 线程 的 

pop() 调 用 并 删除 了 最 后 一 个 元 素 。 这 是 一 个 经 典 的 条 件 竞争 ， 使 用 互 斥 量 对 栈 内 部 数据 进行 
保护 ， 但 依旧 不 能 阻止 条 件 竞争 的 发 生 ， 这 就 是 接口 固有 的 问题 。 


怎么 解决 呢 ? 问题 发 生 在 接口 设计 上 ， 所 以 解决 的 方法 也 就 是 改变 接口 设计 。 有 人 会 问 : 怎 
么 改 ? 在 这 个 简单 的 例子 中 ， 当 调用 top() 时 ， 发 现 栈 已 经 是 空 的 了 ， 那 么 就 抛 出 异常 。 虽 然 
这 能 直接 解决 这 个 问题 ， 但 这 是 一 个 笨拙 的 解决 方案 ， 这 样 的 话 ， 即 使 empty() 返 回 false 的 情 

况 下 ， 你 也 需要 异常 捕获 机 制 。 本 质 上 ， 这 样 的 改变 会 让 empty() 成 为 一 个 多 余 函 数 。 


当 仔 细 的 观察 过 之 前 的 代码 段 ， 就 会 发 现 另 一 个 潜在 的 条 件 竞 争 在 调用 top()J@ 和 pop()@ 之 

闻 。 假 设 两 个 线程 运行 着 前 面 的 代码 ， 并 且 都 引用 同一 个 栈 对 象 S。 这 并 非 军 见 的 情况 ， 当 为 
性 外 nt 多 个 线程 在 不 同 的 数据 上 执行 相同 的 操作 是 很 平常 的 ， 并 且 共 享 同一 个 
栈 可 以 将 工作 分 挫 给 它们 。 假 设 ， 一 开始 栈 中 只 有 两 个 元 素 ， 这 时 任 一 线程 上 的 empty() 和 
top() 都 存在 竞争 ， 只 需要 考虑 可 能 的 执行 顺序 即 可 。 


当 栈 被 一 个 内 部 互 斥 量 所 保护 时 ， 只 有 一 个 线程 可 以 调用 栈 的 成 员 函 数 ， 所 以 调用 可 以 很 好 
地 交错 ， 并 且 do_something() 是 可 以 并 发 运行 的 。 在 表 3.1 中 ， 展 示 一 种 可 能 的 执行 顺序 。 
表 3.1 一 种 可 能 执行 顺序 


Thread A Thread B 
if (ls.empty); 
if(!s.empty); 
int const value = s.top(); 


int const value = s.top(); 


S.pop(); 
do_something(value); s.pop(); 


do_something(value); 


当 线 程 运行 时 ， 调 用 两 次 top()， 栈 没 被 修改 ， 所 以 每 个 线程 能 得 到 同样 的 值 。 不 仅 是 这 样 ， 
在 调用 top() 函 数 调 用 的 过 程 中 (两 次 )，pop() 函 数 都 没有 被 调 有 用。 这样， 在 其 中 一 个 值 再 读 取 
的 时 候 ， 虽 然 不 会 出 现 “ 写 后 读 ” 的 情况 ， 但 其 值 已 被 处 理 了 两 次 。 这 种 条 件 竞争 ， 比 未 定义 的 
ee E; 虽然 其 结果 依赖 于 do_something() 的 结果 ， 但 因为 看 起 来 没有 任 
何 错误 ， 就 会 让 这 个 Bug 很 难 定位 。 


这 就 需要 接口 设计 上 有 和 较 大 的 改动 ， S op pap Tai 
Cargill[1] 指 出 当 一 个 对 象 的 拷贝 ee a Hoo ORBEA ARSA N 
题 。 在 Herb Sutter[2] 看 来 ， 这 个 问题 可 以 从 “异常 安全 "的 角度 完美 解决 ， 不 过 潜在 的 条 件 竞 
争 ， 可 能 会 组 成 一 些 新 的 组 合 。 


说 一 些 大 家 没有 意识 到 的 问题 : 假设 有 一 个 stack<vector<int>> ，Vector 是 一 个 动态 容器 ， 当 
你 找 贝 一 个 vetcor， 标 准 库 会 从 堆 上 分 配 很 多 内 存 来 完成 这 次 找 贝 。 当 这 个 系统 处 在 重度 负 

荷 ， 或 有 严重 的 资源 限制 的 情况 下 ， 这 种 内 存 分 配 就 会 失败 ， 所 以 vector 的 拷贝 构造 函数 可 能 
会 抛 出 一 个 std::bad_alloc 异常 。 当 vector 中 存 有 大 量 元 素 时 ， 这 种 情况 发 生 的 可 能 性 更 大 。 
当 pop() 函 数 返 回 "弹出 值 " 时 (也 就 是 从 栈 中 将 这 个 值 移 除 )， 会 有 一 个 潜在 的 问题 : 这 个 值 被 返 


回 到 调用 函数 的 时 候 ， 栈 才 被 改变 ; 但 当 拷 贝 数 据 的 时 候 ， 调 用 函数 抛 出 一 个 异常 会 怎么 
样 ? 如 果 事 情 丨 的 发 生 了 ， 要 弹出 的 数据 将 会 丢失 ; 它 的 确 从 栈 上 移出 了 ， 但 是 拷贝 失败 
T ! std::stack 的 设计 人 员 将 这 个 操作 分 为 两 部 分 : 先 获取 顶部 元 素 (top())， 然 后 从 栈 中 移 
除 (pop())。 这 样 ， 在 不 能 安全 的 将 元 素 拷 贝 出 去 的 情况 下 ， 栈 中 的 这 个 数据 还 依 昌 存在 ， 没 
有 丢失 。 当 问题 是 堆 空间 不 足 ， 应 用 可 能 会 释放 一 些 内 存 ， 然 后 再 进行 尝试 。 


不 幸 的 是 ， 这 样 的 分 割 却 制造 了 本 想 避 免 或 消除 的 条 件 竞 争 。 幸 运 的 是 ， 我 们 还 有 的 别 的 选 
项 ， 但 是 使 用 这 些 选 项 是 要 付出 代价 的 。 


选项 1 : 传 入 一 个 引用 


第 一 个 选项 是 将 变量 的 引用 作为 参数 ， 传 入 pop() 函 数 中 获取 想 要 的 "弹出 值 ”: 


std::vector<int> result; 
some_stack.pop(result); 


大 多 数 情况 下 ， 这 种 方式 还 不 错 ， 但 有 明显 的 缺点 : 需要 构造 出 一 个 栈 中 类 型 的 实例 ， 用 于 
接收 目标 值 。 对 于 一 些 类 型 ， 这 样 做 是 不 现实 的 ， 因 为 临时 构造 一 个 实例 ， 从 时 间 和 资源 的 
角度 上 来 看 ， 都 是 不 划 工 。 对 于 其 他 的 类 型 ， 这 样 也 不 总 能 行 得 通 ， 因 为 构造 也 数 需要 的 一 
些 参数 ， 在 代码 的 这 个 阶段 不 一 定 可 用 。 最 后 ， 需 要 可 赋值 的 存储 类 型 ， 这 是 一 个 重大 限 

制 : 即使 支持 移动 构造 ， 甚 至 是 找 贝 构造 (从 而 允许 返回 一 个 值 )， 很 多 用 户 自 定 义 类 型 可 能 都 
不 支持 赋值 操作 。 


选项 2 : 无 异常 抛 出 的 拷贝 构造 函数 或 移动 构造 函数 


对 于 有 返回 值 的 pop() 函 数 来 说 ， 只 有 "异常 安全 "方面 的 担忧 ( 当 返 回 值 时 可 以 抛 出 一 个 异常 ) 。 
很 多 类 型 都 有 拷贝 构造 函数 ， 它 们 不 会 抛 出 异常 ， 并 且 随 着 新 标准 中 对 " 右 值 引用 ”的 支持 ( 详 
见 附录 A，A.1 节 )， 很 多 类 型 都 将 会 有 一 个 移动 构造 函数 ， 即 使 他 们 和 拷贝 构造 函数 做 着 相同 
的 事情 ， 它 也 不 会 抛 出 异常 。 一 个 有 用 的 选项 可 以 限制 对 线程 安全 的 栈 的 使 用 ， 并 且 能 让 栈 
安全 的 返回 所 需 的 值 ， 而 不 会 抛 出 弄 常 。 


虽然 安全 ， 但 非 可靠 。 尽 管 能 在 编译 时 可 使 

用 std: :is_nothrow_copy_constructible 和 std: :is_nothrow_move_constructible 类 型 特征 > TŁ 
拷贝 或 移动 构造 函数 不 抛 出 异常 ， 但 是 这 种 方式 的 局 限 性 太 强 。 用 户 自 定义 的 类 型 中 ， 会 有 
不 抛 出 异常 的 拷贝 构造 函数 或 移动 构造 函数 的 类 型 ， 那 些 有 抛 出 异常 的 拷贝 构造 函数 ， 但 没 
有 移动 构造 函数 的 类 型 往往 更 多 (这 种 情况 会 随 着 人 们 习惯 于 C++11 中 的 右 值 引用 而 有 所 改 
变 )。 如 果 这 些 类 型 不 能 被 存储 在 线程 安全 的 栈 中 ， 那 将 是 多 么 的 不 幸 。 

、 选 项 3 : 返回 指向 弹出 值 的 指针 

第 三 个 选择 是 返回 一 个 指向 弹出 元 素 的 指针 ， 而 不 是 直接 返回 值 。 指 针 的 优势 是 自由 拷贝 ， 
并 且 不 会 产生 异常 ， 这 样 你 就 能 避免 Cargill 提 到 的 异常 问题 了 。 缺 点 就 是 返回 一 个 指针 需要 对 
对 象 的 内 存 分 配 进 行 管理 ， 对 于 简单 数据 类 型 (比如 : int)， 内 存 管理 的 开销 要 远大 于 直接 返回 
值 。 对 于 选择 这 个 方案 的 接口 ， 使 用 std::shared_ptr 是 个 不 错 的 选择 ; 不 仅 能 避免 内 存 泄 露 


(因为 当 对 象 中 指针 销毁 时 ， 对 象 也 会 被 销毁 )， 而 且 标 准 库 能 够 完全 控制 内 存 分 配方 案 ， 也 就 
不 需要 new 和 delete 操 作 。 这 种 优化 是 很 重要 的 : 因为 堆栈 中 的 每 个 对 象 ， 都 需要 用 new 进 行 
独立 的 内 存 分 配 ， 相 较 于 非 线 程 安全 版 本 ， 这 个 方案 的 开销 相当 大 。 


选项 4 :“ 选 项 1+ 选项 2” 或 “选项 1+ 选项 3” 


对 于 通用 的 代码 来 说 ， 灵 活性 不 应 忽视 。 当 你 已 经 选择 了 选项 2 或 3 时 ， 再 去 选择 1 也 是 很 容易 
的 。 这 些 选项 提供 给 用 户 ， 让 用 户 自己 选择 对 于 他 们 自己 来 说 最 合适 ， 最 经 济 的 方案 。 


例 : 定义 线程 安全 的 堆栈 


清单 3.4 中 是 一 个 接口 没有 条 件 竞争 的 堆栈 类 定义 ， 它 实现 了 选项 1 和 选项 3 : 重 载 了 pop()， 使 
用 一 个 局 部 引用 去 存储 弹出 值 2 并 返回 一 个 std::shared_ptr<> 对 象 ° 它 有 一 个 简单 的 接口 2 
只 有 两 个 函数 : push() 和 pop(); 


清单 3.4 线程 安全 的 堆栈 类 定义 (概述 ) 


#include <exception> 
#include <memory> // For std::shared_ptr<> 


struct empty_stack: std::exception 
{ 


const char* what() const throw(); 


ti 


template<typename T> 
class threadsafe_stack 
{ 
public: 
threadsafe_stack(); 
threadsafe_stack(const threadsafe_stack&) ; 
threadsafe_stack& operator=(const threadsafe_stack&) = delete; 
// 1 赋值 操作 被 删除 


void push(T new_value); 
std::shared_ptr<T> pop(); 
void pop(T& value); 
bool empty() const; 

J; 


前 减 接口 可 以 获得 最 大 程度 的 安全 ,其 至 限制 对 栈 的 一 些 操 作 。 栈 是 不 能 直接 赋值 的 ， 因 为 赋 

值 操作 已 经 删除 了 @( 详 见 附录 A ，A.2 节 )， 并 且 这 里 没有 swap() 函 数 。 栈 可 以 拷贝 的 ， 假 设 栈 
中 的 元 素 可 以 找 贝 。 当 栈 为 室 时 ，pop() 函 数 会 抛 出 一 个 empty_stack 措 常 ， 所 以 在 empty() 函 

数 被 调用 后 ， 其 他 部 件 还 能 正常 工作 。 如 选项 3 描述 的 那样 ， 使 用 std::shared_ptr 可 以 避免 

内 存 分 配 管理 的 问题 ， 并 避免 多 次 使 用 new 和 delete 操 作 。 扒 栈 中 的 五 个 操作 ， 现 在 就 剩 下 三 
个 : push(), pop() 和 empty()( 这 里 empty() 都 有 些 多 余 )。 简 化 接口 更 有 利于 数据 控制 ， 可 以 保 

证 互 矿 量 将 一 个 操作 完全 锁 住 。 下 面 的 代码 将 展示 一 个 简单 的 实现 一 “封装 std::stack<> 的 

线程 安全 堆栈 。 


清单 3.5 扩充 (线程 安全 ) 堆 栈 


#include <exception> 
#include <memory> 
#include <mutex> 
#include <stack> 


struct empty_stack: std::exception 
{ 
const char* what() const throw() { 
return "empty stack!"; 
}; 
}; 


template<typename T> 
class threadsafe_stack 
{ 
private: 
std::stack<T> data; 
mutable std::mutex m; 


public: 
threadsafe_stack() 
: data(std::stack<T>()){} 


threadsafe_stack(const threadsafe_stack& other) 


{ 
std::lock_guard<std::mutex> lock(other.m); 
data = other.data; // 1 在 构造 函数 体 中 的 执行 拷贝 


threadsafe_stack& operator=(const threadsafe_stack&) = delete; 


void push(T new_value) 

{ 
std::lock_guard<std: :mutex> lock(m); 
data.push(new_value); 


std::shared_ptr<T> pop() 
{ 
std::lock_guard<std: :mutex> lock(m); 
if(data.empty()) throw empty_stack(); // 在 调用 pop 前 ， 检 查 栈 是 否 


std::shared_ptr<T> const res(std: :make_shared<T> 
(data.top())); // 在 修改 堆栈 前 ， 分 配 出 返回 值 

data.pop(); 

return res; 


void pop(T& value) 

{ 
std::lock_guard<std: :mutex> lock(m); 
if(data.empty()) throw empty_stack(); 


value=data.top(); 
data.pop(); 


bool empty() const 
{ 
std::lock guard<std: :mutex> lock(m); 
return data.empty(); 
} 
}; 


堆栈 可 以 拷贝 一 一 拷贝 构造 函数 对 互 不 量 上 锁 ， 再 拷贝 堆栈 。 构 造 函 数 体 中 @ 的 拷贝 使 用 互 斥 
量 来 确保 复制 结果 的 正确 性 ， 这 样 的 方式 比 成 员 初 始 化 列表 好 。 


之 前 对 top() 和 pop() 函 数 的 讨论 中 ， 和 恶性 条 件 竞争 已 经 出 现 ， 因 为 锁 的 粒度 太 小 ， 需 要 保护 的 
操作 并 未 全 履 盖 到 。 不 过 ， 锁 住 的 颗粒 过 大 同样 会 有 问题 。 还 有 一 个 问题 ， 一 个 全 局 互 斥 量 
要 去 保护 全 部 共享 数据 ， 在 一 个 系统 中 存在 有 大 量 的 共享 数据 时 ， 因 为 线程 可 以 强制 运行 ， 
甚至 可 以 访问 不 同位 置 的 数据 ， 抵 消 了 并 发 带 来 的 性 能 提升 。 在 第 一 版 为 多 处 理 器 系统 设计 
Linux 内 核 中 ， 就 使 用 了 一 个 全 局 内 核 锁 。 虽 然 这 个 锁 能 正常 工作 ， 但 在 双核 处 理 系 统 的 上 的 
性 能 要 比 两 个 单 核 系 统 的 性 能 差 很 多 ， 四 核 系统 就 更 不 能 提 了 。 太 多 请 求 去 竞争 占用 内 核 ， 
使 得 依赖 于 处 理 器 运行 的 线程 没有 办 法 很 好 的 工作 。 随 后 修正 的 Linux 内 核 加 入 了 一 个 细 粒 度 
锁 方 案 ， 因 为 少 了 很 多 内 核 竞 争 ， 这 时 四 核 处 理 系统 的 性 能 就 和 单 核 处 理 的 四 倍 差不多 了 。 


使 用 多 个 互 斤 量 保护 所 有 的 数据 ， 细 粒度 锁 也 有 问题 。 如 前 所 述 ， 当 增 大 互 斥 量 履 盖 数据 的 
粒度 时 ， 只 需要 锁 住 一 个 互 斥 量 。 但 是 ， 这 种 方案 并 非 放 之 四 海 蕴 准 ， 比 如 : 互 斤 量 正在 保 
护 一 个 独立 类 的 实例 ; 这 种 情况 下 ， 锁 的 状态 的 下 一 个 阶段 ， 不 是 离开 锁定 区 域 将 锁定 区 域 
还 给 用 户 ， 就 是 有 独立 的 互 不 量 去 保护 这 个 类 的 全 部 实例 。 当 然 ， 这 两 种 方式 都 不 理想 。 


一 个 给 定 操作 需要 两 个 或 两 个 以 上 的 互 斤 量 时 ， 另 一 个 潜在 的 问题 将 出 现 : 死 锁 。 与 条 件 竞 
完全 相反 不 同 的 两 个 线程 会 互相 等 待 ， 从 而 什么 都 没 做 。 





3.2.4 死 锁 : 问题 描述 及 解决 方案 


试想 有 一 个 玩具 ， 这 个 玩具 由 两 部 分 组 成 ， 必 须 拿 到 这 两 个 部 分 ， 才 能 够 玩 。 例 如 ， 一 个 玩 
有 具 鼓 ， 需 要 一 个 鼓 锤 和 一 个 鼓 才 能 玩 。 现 在 有 两 个 小 孩 ， 他 们 都 很 喜欢 玩 这 个 玩具 。 当 其 中 
一 个 孩子 拿 到 了 鼓 和 鼓 狂 时 ， 那 就 可 以 尽情 的 玩 村 了 。 当 另 一 孩子 想 要 玩 ， 他 就 得 等 待 另 一 
孩子 玩 完 才 行 。 再 试想 ， 鼓 和 鼓 狂 被 放 在 不 同 的 玩具 箱 里 ， 并 且 两 个 孩子 在 同一 时 间 里 都 想 
要 去 敲 鼓 。 之 后 ， 他 们 就 去 玩具 箱 里 面 找 这 个 鼓 。 其 中 一 个 找到 了 鼓 ， 并 且 另 外 一 个 找到 了 
鼓 锤 。 现 在 问题 就 来 了 ， 除 非 其 中 一 个 孩子 决定 让 另 一 个 先 玩 ， 他 可 以 把 自己 的 那 部 分 给 另 
外 一 个 孩子 ; 但 当 他 们 都 紧 握 着 自己 所 有 的 部 分 而 不 给 予 ， 那 么 这 个 鼓 谁 都 没 法 玩 。 


现在 没有 孩子 去 争 抢 玩具 ， 但 线程 有 对 锁 的 竞争 : 一 对 线程 需要 对 他 们 所 有 的 互 斤 量 做 一 些 
操作 ， 其 中 每 个 线程 都 有 一 个 互 太 量 ， 且 等 待 另 一 个 解锁 。 这 样 没有 线程 能 工作 ， 因 为 他 们 
都 在 等 待 对 方 释放 互 斥 量 。 这 种 情况 就 是 死 锁 ， 它 的 最 大 问题 就 是 由 两 个 或 两 个 以 上 的 互 斤 
量 来 锁定 一 个 操作 。 


避免 死 锁 的 一 般 建 议 ， 就 是 让 两 个 互 斥 量 总 以 相同 的 顺序 上 锁 : 总 在 互 斥 量 B 之 前 锁 住 互 斥 量 
A， 就 永远 不 会 死 锁 。 某 些 情况 下 是 可 以 这 样 用 ， 因 为 不 同 的 互 斥 量 用 于 不 同 的 地 方 。 不 过 ， 
事情 没 那 么 简单 ， 比 如 : 当 有 多 个 互 斥 量 保 护 同一 个 类 的 独立 实例 时 ， 一 个 操作 对 同一 个 类 
的 两 个 不 同 实例 进行 数据 的 交换 操作 ， 为 了 保证 数据 交换 操作 的 正确 性 ， 就 要 避免 数据 被 并 
发 修改 ， 并 确保 每 个 实例 上 的 互 斥 量 都 能 锁 住 自己 要 保护 的 区 域 。 不 过 ， 选 择 一 个 固定 的 顺 
序 ( 例 如 ， 实 例 提供 的 第 一 互 不 量 作为 第 一 个 参数 ， 提 供 的 第 二 个 互 斥 量 为 第 二 个 参数 )， 可 能 
会 适得其反 : 在 参数 交换 了 之 后 ， 两 个 线程 试图 在 相同 的 两 个 实例 间 进 行 数据 交换 时 ， 程 序 
又 死 锁 了 | 


很 幸运 ，C++ 标 准 库 有 办 法 解决 这 个 问题 std lock 一 一 可 以 一 次 性 锁 住 多 个 (两 个 以 上 ) 的 
互 打量 ， 并 且 没有 副作用 ( 死 锁 风险 ) 。 下 面 的 程序 清单 中 ， 就 来 看 一 下 怎么 在 一 个 简单 的 交换 
操作 中 使 用 std::lock ° 


清单 3.6 交换 操作 中 使 用 std: :lock() 和 std: : lock_guard 


// 这 里 的 std: :Lock() 需 要 包含 <muteXx> 头 文件 
class some_big object; 
void swap(some big object& lhs,some big object& rhs); 
class X 
{ 
private: 
some_big_object some_detail; 
std::mutex m; 
public: 
X(some_big_object const& sd):some_detail(sd){} 


friend void swap(X& lhs, X& rhs) 
{ 
if (&lhs==&rhs ) 
return; 
std::lock(lhs.m,rhs.m); // 1 
std::lock_guard<std: :mutex> lock_a(lhs.m,std::adopt_lock); 
// 2 
std::lock_guard<std::mutex> lock_b(rhs.m,std::adopt_lock); 
HU B 
swap(lhs.some_detail, rhs.some_detail); 


首先 ， 检 查 参 数 是 否 是 不 同 的 实例 ， 因 为 操作 试图 获取 std: :mutex 对 象 上 的 锁 ， 所 以 当 其 被 
获取 时 ， 结 果 很 难 预料 。( 一 个 互 斥 量 可 以 在 同一 线程 上 多 次 上 锁 ， 标 准 库 

中 std::recursive_mutex 提供 这 样 的 功能 。 详情 见 3.3.3 节 ) 。 然 后 ， 调 用 std: :lock() DAAE 
AS EIS > HAA std:lock_guard 实例 已 经 创建 好 @G@。 提 供 std: :adopt lock 参数 除了 
表示 std::lock_guard 对 象 可 获取 锁 之 外 ， 还 将 锁 交 由 sta: :lock_guard 对 象 管理 ， 而 不 需 
要 std::lock_guard 对 象 再 去 构建 新 的 锁 。 


这 样 ， 就 能 保证 在 大 多 数 情况 下 ， 函 数 退 出 时 互 斤 量 能 被 正确 的 解锁 (保护 操作 可 能 会 抛 出 一 
个 异常 )， 也 允许 使 用 一 个 简单 的 “return” 作 为 返回 。 还 有 ， 需 要 注意 的 是 ， 当 使 
用 std::lock 去 锁 |hs.m 或 rhs.m 时 ， 可 能 会 抛 出 异常 ; 这 种 情况 下 ， 弄 常会 传播 


到 std::lock 之 外 。 当 std::lock 成 功 的 获取 一 个 互 斥 量 上 的 锁 ， 并 且 当 其 尝试 从 另 一 个 互 斥 
量 上 再 获取 锁 时 ， 就 会 有 异常 抛 出 ， 第 一 个 锁 也 会 随 着 异常 的 产生 而 自动 释放 ， 所 
以 std::lock 要 么 将 两 个 锁 都 锁 住 ， 要 不 一 个 都 不 锁 。 


虽然 std::lock 可 以 在 这 情况 下 (获取 两 个 以 上 的 锁 ) 避 免 死 锁 ， 但 它 没 办 法 帮助 你 获取 其 中 一 
个 锁 。 这 时 ， 不 得 不 依赖 于 开发 者 的 纪律 性 ( 译 者 : 也 就 是 经 验 )， ganas 的 程序 不 会 死 锁 。 
这 并 不 简单 : 死 锁 是 多 线程 编程 中 一 个 令 人 相当 头痛 的 问题 ， 并 且 死 锁 经 常 是 不 可 预见 的 ， 
因为 在 大 多 数 时 间 里 ， 所 有 工作 都 能 很 好 的 完成 。 不 过 ， 也 一 些 相 对 简单 的 规则 能 帮助 写 

出 “无 死 锁 ?的 代码 。 


3.2.5 避免 死 锁 的 进 阶 指导 


虽然 锁 是 产生 死 锁 的 一 般 原 因 ， 但 也 不 排除 死 锁 出 现在 其 他 地 方 。 无 锁 的 情况 下 ， 仅 需要 每 
个 std::thread 对 象 调用 join()， 两 个 线程 就 能 产生 死 锁 。 这 种 情况 下 ， 没 有 线程 可 以 继续 运 
行 ， 因 为 他 们 正在 互相 等 待 。 这 种 情况 很 常见 ， 一 个 线程 会 等 待 另 一 个 线程 ， 其 他 线程 同时 
也 会 等 待 第 一 个 线程 结束 ， 所 以 三 个 或 更 多 线程 的 互相 等 待 也 会 发 生死 锁 。 为 了 避免 死 锁 ， 
这 里 的 指导 意见 为 : 当 机 会 来 临时 ， 不 要 拱手 让 人 。 以 下 提供 一 些 个 人 的 指导 建议 ， 如 何 识 
别 死 锁 ， 并 消除 其 他 线程 的 等 待 。 
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第 一 个 建议 往往 是 最 简单 的 : 一 个 线程 已 获得 一 个 锁 时 ， 再 别 去 获取 第 二 个 。 如 果 能 坚持 这 
个 建议 ， 国 为 每 个 线程 只 持 有 一 个 锁 ， 锁 上 就 不 会 产生 死 锁 。 即 使 互 斥 锁 造 成 死 锁 的 最 常见 

原因 ， 也 可 能 会 在 其 他 方面 受到 死 锁 的 困扰 (比如 : 线程 间 的 互相 等 待 )。 当 你 需要 获取 多 个 

锁 ， 使 用 一 个 stdz:lock 来 做 这 件 事 (对 获取 锁 的 操作 上 人 锁 )， 避 免 产 生死 锁 。 


避免 在 持 有 锁 时 调用 用 户 提 供 的 代码 


第 二 个 建议 是 次 简单 的 : 因为 代码 是 用 户 提 供 的 ， 你 没有 办 法 确定 用 户 要 做 什么 ; 用 户 程序 

可 能 做 任何 事情 ， 包 括 获 取 锁 。 你 在 持 有 锁 的 情况 下 ， 调 用 用 户 提供 的 代码 ; 如 果 用 户 代码 

要 获取 一 个 锁 ， 就 会 违反 第 一 个 指导 意见 ， 并 造成 死 锁 ( 有 时 ， 这 是 无 法 避免 的 )。 当 你 正在 写 
一 份 通用 代码 ， 例 如 3.2.3 中 的 栈 ， 每 一 个 操作 的 参数 类 型 ， 都 在 用 户 提供 的 代码 中 定义 ， 就 
需要 其 他 指导 意见 来 帮助 你 。 


使 用 固定 顺序 获取 锁 


当 硬 性 条 件 要 求 你 获取 两 个 以 上 (包括 两 个 ) 的 锁 ， 并 且 不 能 使 用 std::lock 单独 操作 来 获取 它 
们 ;那么 最 好 在 每 个 线程 上 ， 用 固定 的 顺序 获取 它们 获取 它们 ( 锁 )。3.2.4 节 中 提 到 一 种 当 需 要 
获取 两 个 互 斥 量 时 ， 避 免 死 锁 的 方法 : 关键 是 如 何在 线程 之 间 ， 以 一 定 的 顺序 获取 锁 。 一 些 
情况 下 ， 这 种 方式 相对 简单 。 比 如 ，3.2.3 节 中 的 栈 一 一 每 个 栈 实例 中 都 内 置 有 互 斥 量 ， 但 是 
对 数据 成 员 存 储 的 操作 上 ， 栈 就 需要 带 调 用 用 户 提供 的 代码 。 虽 然 ， 可 以 添加 一 些 约束 ， 对 


栈 上 存储 的 数据 项 不 做 任何 操作 ， 对 数据 项 的 处 理 仅 限于 栈 自身 。 这 会 给 用 户 提 供 的 栈 增加 
一 些 负 担 ， 但 是 一 个 容器 很 少 去 访问 另 一 个 容器 中 存储 的 数据 ， 即 使 发 生 了 也 会 很 明显 ， 所 
以 这 对 于 通用 栈 来 说 并 不 是 一 个 特别 沉重 的 负担 。 


其 他 情况 下 ， 这 就 不 会 那么 简单 了 ， 例 如 : 3.2.4 节 中 的 交换 操作 ， 这 种 情况 下 你 可 能 同时 锁 
住 多 个 互 斥 量 (但 是 有 时 不 会 发 生 )。 当 回 看 3.1 节 中 那个 链表 连接 例子 时 ， 将 会 看 到 列表 中 的 
每 个 节点 都 会 有 一 个 互 斥 量 保护 。 为 了 访问 列表 ， 线 程 必须 获取 他 们 感 兴 趣 节点 上 的 互 斥 

锁 。 当 一 个 线程 删除 一 个 节点 ， 它 必须 获取 三 个 节点 上 的 互 斥 锁 : 将 要 删除 的 节点 ， 两 个 令 
接 节点 (因为 他 们 也 会 被 修改 )。 同 样 的 ， 为 了 遍历 链表 ， 线 程 必须 保证 在 获取 当前 节点 的 互 斥 
锁 前 提 下 ， 获 得 下 一 个 节点 的 锁 ， 要 保证 指向 下 一 个 节点 的 指针 不 会 同时 被 修改 。 一 旦 下 一 
个 节点 上 的 锁 被 获取 ， 那 么 第 一 个 节点 的 锁 就 可 以 释放 了 ， 因 为 没有 持 有 它 的 必要 性 了 。 


这 种 “ 手 递 手 " 锁 的 模式 允许 多 个 线程 访问 列表 ， 为 每 一 个 访问 的 线程 提供 不 同 的 节点 。 但 是 ， 
为 了 避免 死 锁 ， 节 点 必须 以 同样 的 顺序 上 锁 : 如 果 两 个 线程 试图 用 互 为 反 向 的 顺序 ， 使 用 “ 手 
递 手 ? 锁 遍历 列表 ， 他 们 将 执行 到 列表 中 间 部 分 时 ， 发 生死 锁 。 当 节点 A 和 B 在 列表 中 相 邻 ， 当 
前 线程 可 能 会 同时 尝试 获取 A 和 B 上 的 锁 。 另 一 个 线程 可 能 已 经 获取 了 节点 B 上 的 锁 ， 并 且 试 
图 获取 节点 A 上 的 锁 经 典 的 死 锁 场 景 。 





当 A、C 节 点 中 的 B 节 点 正在 被 删除 时 ， 如 果 有 线程 在 已 获取 A 和 C 上 的 锁 后 ， 还 要 获取 B 节 点 
上 的 锁 时 ， 当 一 个 线程 遍历 列表 的 时 候 ， 这 样 的 情况 就 可 能 发 生死 锁 。 这 样 的 线程 可 能 会 试 
图 首先 锁 住 A 节点 或 C 节 点 (根据 遍历 的 方向 )， 但 是 后 面 就 会 发 现 ， 它 无 法 获得 B 上 的 锁 ， 因 为 
线程 在 执行 删除 任务 的 时 候 ， 已 经 获取 了 B 上 的 锁 ， 并 且 同 时 也 获取 了 A 和 C 上 的 锁 。 


这 里 提供 一 种 避免 死 锁 的 方式 ， 定 义 遍 历 的 顺序 ， 所 以 一 个 线程 必须 先 锁 住 A 才 能 获取 B 的 
锁 ， 在 锁 住 B 之 后 才能 获取 C 的 锁 。 这 将 消除 死 锁 发 生 的 可 能 性 ， 在 不 允许 反 向 遍历 的 列表 
上 。 类 似 的 约定 常 被 用 来 建立 其 他 的 数据 结构 。 

使 用 锁 的 层次 结构 

虽然 ， 这 对 于 定义 锁 的 顺序 ， 的 确 是 一 个 特殊 的 情况 ， 但 锁 的 层次 的 意义 在 于 提供 对 运行 时 
约定 是 否 被 坚持 的 检查 。 这 个 建议 需要 对 你 的 应 用 进行 分 层 ， 并 且 识 别 在 给 定 层 上 所 有 可 上 
锁 的 互 斥 量 。 当 代码 试图 对 一 个 互 斥 量 上 锁 ， 在 该 层 锁 已 被 低层 持 有 时 ， 上 锁 是 不 允许 的 。 
你 可 以 在 运行 时 对 其 进行 检查 ， 通 过 分 配 层 数 到 每 个 互 斥 量 上 ， 以 及 记录 被 每 个 线程 上 锁 的 
互 不 量 。 下 面 的 代码 列表 中 将 展示 两 个 线程 如 何 使 用 分 层 互 不 。 


清单 3.7 使 用 层次 锁 来 避免 死 锁 


hierarchical_mutex high_level_mutex(10000); // 1 
hierarchical_mutex low_level_mutex(5000); // 2 


int do_low_level_stuff(); 


int low_level_func() 


{ 


std::lock_guard<hierarchical_mutex> 1k(low_level_mutex); // 3 
return do_low_level_stuff(); 


void high_level_stuff(int some_param); 


void high_level_func() 

{ 
std::lock_guard<hierarchical_mutex> 1k(high_level_mutex); // 4 
high_level_stuff(low_level_func()); // 5 


} 
void thread_a() // 6 
{ 

high level func); 
} 


hierarchical_mutex other_mutex(100); // 7 
void do_other_stuff(); 


void other_stuff() 

{ 
high_level_func(); // 8 
do_other_stuff(); 


void thread_b() // 9 
{ 


std::lock_guard<hierarchical_mutex> 1k(other_mutex); // 10 
other_stuff(); 


thread_a()@ 遵 守 规则 ， 所 以 它 运 行 的 没 问题 。 另 一 方面 ，thread_b()@ 无 视 规则 ， 因 此 在 运 
行 的 时 候 肯 定 会 失败 。thread_al() 调 用 high_level func()， 让 high_level _mutex@ 上 锁 (其 层级 
值 为 10000@@)， 为 了 获取 high_level_stuff() 的 参数 对 互 斥 量 上 锁 ， 之 后 调用 

Ilow level func()®。low_level func() 会 对 low_level_mutex 上 锁 ， 这 就 没有 问题 了 ， 因 为 这 个 
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thread_b() 运 行 就 不 会 顺利 了 。 首 先 ， 它 锁 住 了 other_mutex@， 这 个 互 斥 量 的 层级 值 只 有 
bene Rien ， 超 低层 级 的 数据 已 被 保护 。 当 other_stuff() 调 用 high_level func()@ 时 ， 
就 违反 了 层级 结构 : high_level func() 试 图 获取 high_level_mutex， 这 个 互 斥 量 的 层级 值 是 
10000 ° re 前 层级 值 100 大 很 多 。 因 此 hierarchical _mutex 将 会 产生 一 个 错误 ， 可 能 会 是 抛 

出 一 个 异常 ， 或 直接 终止 程序 。 在 层级 互 斥 量 上 产生 死 锁 ， 是 不 可 能 的 ， 因 为 互 斥 量 本 身 会 
严格 遵循 约定 顺序 ， 进 行 上 锁 。 这 也 意味 ， 当 多 个 互 斤 量 在 是 在 同一 级 上 时 ， 不 能 同时 持 有 
多 个 锁 ， 所 以 " 手 递 手 " 锁 的 方案 需要 每 个 互 斥 量 在 一 条 链 上 ， 并 且 每 个 互 斥 量 都 比 其 前 一 个 有 
更 低 的 层级 值 ， 这 在 某 些 情 况 下 无 法 实现 。 


例子 也 展示 JAR? std: : lock_guard<> 模板 与 用 户 定义 的 互 斥 量 类 型 一 起 使 用 。 虽 然 
hierarchical_mutex 不 是 c++ 标准 的 一 部 分 ， 但 是 它 写 起 来 很 容易 ; 一 个 简单 的 实现 在 列表 
3.8 中 展示 出 来 。 尽 管 它 是 一 个 用 户 定义 类 型 ， 它 可 以 用 于 std::lock_guard<> 模板 中 ， 因 为 它 
的 实现 有 三 个 成 员 通 数 为 了 满足 互 斥 量 操作 : lock(), unlock() 和 try_lock()。 虽 然 你 还 没 见 过 
try_lock() 怎 么 使 用 ， 但 是 其 使 用 起 来 很 简单 : 当 互 斥 量 上 的 锁 被 一 个 线程 持 有 ， 它 将 返回 
false， 而 不 是 等 待 调用 的 线程 ， 直 到 外 上 为 改作 
现 中 ，try_lock() 会 作为 避免 死 锁 算 法 的 一 部 分 


列表 3.8 简单 的 层级 互 矿 量 实现 
class hierarchical_mutex 
{ 


std::mutex internal_mutex; 


unsigned long const hierarchy_value; 
unsigned long previous_hierarchy_value; 


static thread_local unsigned long this_thread_hierarchy_value; 
pio 


void check_for_hierarchy_violation( ) 


{ 
if(this_thread_hierarchy_value <= hierarchy_value) // 2 
{ 
throw std::logic_error(“mutex hierarchy violated”); 
} 


void update_hierarchy_value() 

{ 
previous_hierarchy_value=this_thread_hierarchy_value; // 3 
this_thread_hierarchy_value=hierarchy_value; 


public: 
explicit hierarchical_mutex(unsigned long value): 
hierarchy_value(value), 
previous_hierarchy_value(0) 


{} 


void lock() 

{ 
check_for_hierarchy_violation(); 
internal_mutex.lock(); // 4 
update_hierarchy_value(); // 5 


void unlock() 

{ 
this_thread_hierarchy_value=previous_hierarchy_value; // 6 
internal_mutex.unlock(); 


bool try_lock() 
{ 
check_for_hierarchy_violation(); 
if(!internal_mutex.try_lock()) // 7 
return false; 
update_hierarchy_value(); 
return true; 
} 
}; 
thread_local unsigned long 
hierarchical_mutex::this_thread_hierarchy_value(ULONG_MAX); 
// 8 


这 里 重点 是 使 用 了 thread local 的 值 来 代表 当前 线程 的 层级 值 : 
this_thread_hierarchy_value@。 它 被 初始 化 为 最 大 值 国 ， 所 以 最 初 所 有 线程 都 能 被 锁 住 。 
为 其 声明 中 有 thread _ local， 所 以 每 个 线程 都 有 其 拷贝 副本 ， 这 样 线程 中 变量 状态 完全 独立 ， 
当 从 另 一 个 线程 进行 读 取 时 ， 变 量 的 状态 也 完全 独立 。 参 见 附录 A，A.8 节 ， 有 更 多 与 
thread _ local 相关 的 内 容 。 


所 以 ， 第 一 次 线程 锁 住 一 个 hierarchical _mutex 时 ，this thread _hierarchy _value 的 值 是 
ULONG_MAX。 由 于 其 本 身 的 性 质 ， 这 个 值 会 大 于 其 他 任何 值 ， 所 以 会 通过 

check_ for_hierarchy_vilation()@ 的 检查 。 在 这 种 检查 方式 下 ，lock() 代 表 内 部 互 斥 锁 已 被 锁 住 
@ 图 。 一 旦 成 功 锁 住 ， 你 可 以 更 新 层级 值 了 四。 


当 你 现在 锁 住 另 一 个 hierarchical _mutex 时 ， 还 持 有 第 一 个 锁 ，this_thread_hierarchy_value 
的 值 将 会 显示 第 一 个 互 斥 量 的 层级 值 。 第 二 个 互 斥 量 的 层级 值 必须 小 于 已 经 特有 互 斥 量 检查 
函数 @ 才 能 通过 


现在 ， 最 重要 的 是 为 当前 线程 存储 之 前 的 层级 值 ， 所 以 你 可 以 调用 unlock()@ 对 层级 值 进行 保 
存 ; 否则 ， 就 锁 不 住 任何 互 斥 量 ( 第 二 个 互 斥 量 的 层级 数 高 于 第 一 个 互 斥 量 )， 即 使 线程 没有 持 
有 任何 锁 。 因 为 保存 了 之 前 的 层级 值 ， 只 有 当 持 有 internal_mutex@@， 且 在 解锁 内 部 互 斤 量 @ 
之 前 存储 它 的 层级 值 ， 才 能 安全 的 将 hierarchical _mutex 自 身 进 行 存储 。 这 是 因为 
hierarchical_mutex 被 内 部 互 斥 量 的 锁 所 保护 着 。 


try_lock() 与 lock() 的 功能 相似 ， 除 了 在 调用 internal_mutex 的 try_lock()@ 失 败 时 ， 不 能 持 有 对 
应 锁 ， 所 以 不 必 和 更 新 层级 值 ， 并 直接 返回 false。 


虽然 是 运行 时 检测 ， 但 是 它 没 有 时 间 依 赖 性 ws 
同时 ， 设 计 过 程 需 要 去 拆 分 应 用 ， 互 斥 量 在 这 样 的 情况 下 可 以 消除 可 能 导致 死 锁 的 可 能 性 。 
这 样 的 设计 练习 很 有 必要 去 做 一 下 ， 即 使 你 之 后 没有 去 做 ， 代 码 也 会 在 运行 时 进 。 





超越 锁 的 延伸 扩展 


如 我 在 本 节 开 头 提 到 的 那样 ， 死 锁 不 仅仅 会 发 生 在 锁 之 间 ; 死 锁 也 会 发 生 在 任何 同步 构造 中 
(可 能 会 产生 一 个 等 待 循环 )， 因 此 这 方面 也 需要 有 指导 意见 ， 例 如 : 要 去 避免 获取 许 套 锁 等 待 
一 个 持 有 和 锁 的 线程 是 一 个 很 粮 糕 的 决定 ， 因 为 线程 为 了 能 继续 运行 可 能 需要 获取 对 应 的 锁 。 
类 似 的 ， 如 果 去 等 待 一 个 线程 结束 ， 它 应 该 可 以 确定 这 个 线程 的 层级 ， 这 样 一 个 线程 只 需要 
等 待 比 起 层级 低 的 线程 结束 即 可 。 可 以 用 一 个 简单 的 办 法 去 确定 ， 以 添加 的 线程 是 否 在 同一 
汐 数 中 被 启动 ， 如 同 在 3.1.2 节 和 3.3 节 中 描述 的 那样 。 

当代 码 已 经 能 规避 死 锁 ， std::1lock() 和 std::lock_guard 能 组 成 简单 的 锁 履 盖 大 多 数 情 况 ， 
但 是 有 时 需要 更 多 的 灵活 性 。 在 这 些 情况 ， 可 以 使 用 标准 库 提 供 的 std::unique_lock 模板 。 
如 std::lock_guard ， eee ， 并 且 它 提供 很 多 RAII 类 型 锁 用 来 管 
理 std::lock_guard 类 型 ， 可 以 让 代码 更 加 灵活 。 


3.2.6 std::unique_lock—— & %% 49 4 


std: :unqiue_lock 使 用 更 为 自由 的 不 变量 ， 这 样 std: :unique_lock 实例 不 会 总 与 互 斥 量 的 数 
据 类 型 相关 ， 使 用 起 来 要 比 std:lock_guard 更 加 灵活 。 首 先 ， 可 将 std::adopt_lock 作为 第 二 
个 参数 传 入 构造 函数 ， 对 互 斥 量 进行 管理 ; 也 可 以 将 std::defer_lock 作为 第 二 个 参数 传递 进 
去 ， 表 明 互 斥 量 应 保持 解锁 状态 。 这 样 ， 就 可 以 被 std::unique_lock 对 象 (不 是 互 矿 量 ) 的 
lock() 函 数 的 所 获取 ， 或 传递 std::unique_lock 对 象 到 std::lock() 中 。 清 单 3.6 可 以 轻易 的 转 
换 为 清单 3.9 ， 使 用 std: :unique_lock 和 std: :defer_lock ® > mn 
非 std::lock_guard 和 std: :adopt_lock ° 代码 长 度 相 同 ， 几乎 等 价 ， 唯一 不 同 的 就 
是 : std::unique_lock 会 占用 比较 多 的 空间 ， 并 且 比 std::lock_guard 稍 慢 一 些 。 保 证 灵活 性 
要 付出 代价 > 这 个 代价 就 是 允许 std: :unique_ lock 实例 不 带 互 斤 量 : 信息 已 被 存储 ， 且 已 被 
更 新 。 


清单 3.9 交换 操作 中 std::lock() 和 std::unique_lock 的 使 用 


class some_big object; 
void swap(some_big_ object& lhs,some big object& rhs); 
class X 
{ 
private: 
some_big_object some_detail; 
std::mutex m; 
public: 
X(some_big_object const& sd):some_detail(sd){} 
friend void swap(X& lhs, X& rhs) 
{ 
if(&lhs==&rhs ) 
return; 
std: :unique_lock<std::mutex> lock_a(lhs.m,std::defer_lock); 
(ak 
std: :unique_lock<std::mutex> lock_b(rhs.m,std::defer_lock); 
// 1 std::def_lock @FALMHARE 
std::lock(lock_a,lock_b); // 2 FEAR LA 
swap(1hs.some_detail,rhs.some_detail); 
} 
}; 


列表 3.9 中 ， 因 为 std::unique_lock 支持 lock(), try_lock()#*unlock() me i BAe > PVA HE 
将 std::unique_lock 对 象 传递 到 std::lock() @@。 这 些 同名 的 成 员 函 数 在 低层 做 着 实际 的 工 
作 ， 并 且 仅 更 新 std::unique_lock 实例 中 的 标志 ， 来 确定 该 实例 是 否 拥 有 特定 的 互 斥 量 ， 这 


个 标志 是 为 了 确保 Unlock() 在 析 构 函数 中 被 正确 调用 。 如 果实 例 拥有 互 斥 量 ， 那 么 析 构 函数 必 
须 调用 unlock() ; 但 当 实 例 中 没有 互 斥 量 时 ， 析 构 函 数 就 不 能 去 调用 unlock()。 这 个 标志 可 以 
通过 owns lock() 成 员 变 量 进行 查询 。 


可 能 如 你 期 望 的 那样 ， 这 个 标志 被 存储 在 某 个 地 方 。 因 此 ， std::unique_lock 对 象 的 体积 通 
常 要 比 std: :lock_guard at RK ， 当 使 用 std: :unique_lock 替代 std::lock_guard ， 因为 会 对 
标志 进行 适当 的 更 新 或 检查 ， 就 会 做 些 轻微 的 性 能 惩罚 。 当 std::lock_guard 已 经 能 够 满足 你 
的 需求 ， 那 么 还 是 建议 你 继续 使 用 它 。 当 需要 更 加 灵活 的 锁 时 ， 最 好 选 

择 std: :unique_lock ， 因为 它 更 适合 于 你 的 任务 。 你 已 经 看 到 一 个 递 延 锁 的 例子 ， 另 外 一 种 
情况 是 锁 的 所 有 权 需 要 从 一 个 域 转 到 另 一 个 域 。 


3.2.7 不 同 域 中 互 矿 量 所 有 权 的 传递 


std::unique_lock 实例 没有 与 自身 相关 的 互 矿 量 ， 一 个 互 斥 量 的 所 有 权 可 以 通过 移动 操作 ， 
在 不 同 的 实例 中 进行 传递 。 某 些 情况 下 ， 这 种 转移 是 自动 发 生 的 ， 例 如 : 当 函 数 返回 一 个 实 
例 ; 另 些 情况 下 ， 需 要 显 式 的 调用 std: :move() 来 执行 移动 操作 。 从 本 质 上 来 说 ， 需 要 依赖 于 
源 值 是 否 是 左 值 一 一 个 实际 的 信 或 是 引用 一 或 一 个 右 值 一 一 一 个 临时 类 型 。 当 源 什 是 一 
个 右 值 ， 为 了 避免 转移 所 有 权 过 程 出 错 ， 就 必须 显 式 移动 成 左 值 。 std::unique_lock 是 可 移 
动 ， 但 不 可 赋值 的 类 型 。 附 录 A，A.1.1 节 有 更 多 与 移动 语句 相关 的 信息 。 





一 种 使 用 可 能 是 允许 一 个 函数 去 锁 住 一 个 互 太 量 ， 并 且 将 所 有 权 移 到 调用 者 上 ， 所 以 调用 者 
可 以 在 这 个 锁 保护 的 范围 内 执行 额外 的 动作 。 


下 面 的 程序 片段 展示 了 : 函数 get_lock() 锁 住 了 互 斥 量 ， 然 后 准备 数据 ， 返 回 锁 的 调用 函数 : 


std: :unique_lock<std::mutex> get_lock() 


{ 
extern std::mutex some_mutex; 
std::unique_lock<std::mutex> 1k(some_mutex) ; 
prepare_data(); 
return lk; // 1 

} 

void process_data() 

{ 


std::unique_lock<std::mutex> lk(get_lock()); // 2 
do_something(); 


上 k 在 函数 中 被 声明 为 自动 变量 ， 它 不 需要 调用 std::move() ， 可 以 直接 返回 @( 编 译 器 负责 调用 
移动 构造 函数 )。process_data() 函 数 直 接 转移 std::unique_lock 实例 的 所 有 权 @@， 调 用 
do_something() 可 使 用 的 正确 数据 (数据 没有 受到 其 他 线程 的 修改 )。 


通常 这 种 模式 会 用 于 已 锁 的 互 太 量 ， 其 依赖 于 当前 程序 的 状态 ， 或 依赖 于 传 入 返回 类 型 

为 std::unique_lock 的 函数 (或 以 参数 返回 )。 这 样 的 用 法 不 会 直接 返回 锁 ， 不 过 网 关 类 的 一 个 
数据 成 员 可 用 来 确认 已 经 对 保护 数据 的 访问 权限 进行 上 锁 。 这 种 情况 下 ， 所 有 的 访问 都 必须 
通过 网 关 类 : 当 你 想 要 访问 数据 ， 需 要 获取 网 关 类 的 实例 (如 同 前 面 的 例子 ， 通 过 调用 

get lock() 之 类 函数 ) 来 获取 锁 。 之 后 你 就 可 以 通过 网 关 类 的 成 员 有 函数 对 数据 进行 访问 。 当 完成 
访问 ， 可 以 销毁 这 个 网 关 类 对 象 ， 将 锁 进 行 释放 ， 让 别 的 线程 来 访问 保护 数据 。 这 样 的 一 个 
网 关 类 可 能 是 可 移动 的 (所 以 他 可 以 从 一 个 函数 进行 返回 )， 在 这 种 情况 下 锁 对 象 的 数据 必须 是 
可 移动 的 。 


std: :unique_lock 的 灵活 性 同样 也 允许 实例 在 销毁 之 前 放弃 其 拥有 的 锁 。 可 以 使 用 unlock() 来 
做 这 件 事 ， 如 同一 个 互 斥 量 : std: :unique_lock BY mh Hh TEBE RF Ait 3 Fe AB Gi BR AY) 
功能 。 std: :unique_lock 实例 在 销毁 前 释放 锁 的 能 力 ， 当 锁 没有 必要 在 持 有 的 时 候 ， 可 以 在 
特定 的 代码 分 支 对 其 进行 选择 性 的 释放 。 这 对 于 应 用 性 能 来 说 很 重要 ， 因 为 持 有 锁 的 时 间 增 
加 会 导致 性 能 下 降 ， 其 他 线程 会 等 待 这 个 锁 的 释放 ， 避 免 超 越 操作 。 


3.2.8 锁 的 粒度 


3.2.3 节 中 ， 已 经 对 锁 的 粒度 有 所 了 解 : 锁 的 粒度 是 一 个 摆手 术语 (hand-waving term)， 用 来 描 
述 通过 一 个 锁 保 护 着 的 数据 量 大 小 。 一 个 细 粒 度 锁 (a fine-grained lock) 能 够 保护 较 小 的 数据 
量 ， 一 个 粗 粒 度 锁 (a coarse-grained lock) 能 够 保护 较 多 的 数据 量 。 选 择 粒度 对 于 锁 来 说 很 重 
要 ， 为 了 保护 对 应 的 数据 ， 保 证 锁 有 能 力 保 护 这 些 数据 也 很 重要 。 我 们 都 知道 ， 在 超市 等 待 
结账 的 时 候 ， 正 在 结账 的 顾客 突然 意识 到 他 忘 了 拿 草 越 壮 桨 ， 然 后 离开 柜台 去 拿 ， 并 让 其 他 
的 人 都 等 待 他 回来 ; 或 者 当 收 银 员 ， 准 备 收 钱 时 ， 顾 客 才 去 翻 钱包 拿 钱 ， 这 样 的 情况 都 会 让 
等 待 的 顾客 很 无 奈 。 当 每 个 人 都 检查 了 自己 要 拿 的 东西 ， 且 能 随时 为 拿 到 的 商品 进行 支付 ， 
那么 的 每 件 事 都 会 进行 的 很 顺利 。 


这 样 的 道理 同样 适用 于 线程 : 如 果 很 多 线程 正在 等 待 同一 个 资源 (等 待 收银 员 对 自己 拿 到 的 商 
品 进行 清点 )， 当 有 线程 持 有 锁 的 时 间 过 长 ， 这 就 会 增加 等 待 的 时 间 ( 别 等 到 结账 的 时 候 ， 才 想 
起 来 芝 越 茬 桨 没 拿 )。 在 可 能 的 情况 下 ， 锁 住 互 斤 量 的 同时 只 能 对 共享 数据 进行 访问 ; 试图 对 
锁 外 数据 进行 处 理 。 特 别 是 做 一 些 费时 的 动作 ， 比 如 : 对 文件 的 输入 /输出 操作 进行 上 锁 。 文 
件 输 入 /输出 通常 要 比 从 内 存 中 读 或 写 同样 长 度 的 数据 慢 成 百 上 千 倍 ， 所 以 除非 锁 已 经 打算 去 
保护 对 文件 的 访问 ， 要 么 执行 输入 /输出 操作 将 会 将 延迟 其 他 线程 执行 的 时 间 ， 这 很 没有 必要 
(因为 文件 锁 阻 塞 住 了 很 多 操作 )， 这 样 多 线程 带 来 的 性 能 效益 会 被 抵消 。 


std::unique_lock 在 这 种 情况 下 工作 正常 ， 在 调用 unlock() 时 ， 代 码 不 需要 再 访问 共享 数据 ; 
而 后 当 再 次 需要 对 共享 数据 进行 访问 时 ， 就 可 以 再 调用 lock() 了 。 下 面 代码 就 是 这 样 的 一 种 情 
ou: 


void get_and_process_data() 

{ 
std: :unique_lock<std::mutex> my_lock(the_mutex); 
some_class data_to_process=get_next_data_chunk(); 
my_lock.unlock(); // 1 不 要 让 锁 住 的 互 斥 量 越 过 Drocess() 函 数 的 调用 
result_type result=process(data_to_process); 
my_lock.lock(); // 2 为 了 写 入 数据 ， 对 互 斥 量 再 次 上 锁 
write_result(data_to_process,result); 





不 需要 让 锁 住 的 互 斥 量 越过 对 process() 函 数 的 调用 ， 所 以 可 以 在 函数 调用 加 前 对 互 斥 量 手动 
解锁 ， 并 且 在 之 后 对 其 再 次 上 锁 @ 。 


这 能 表示 只 有 一 个 互 斥 量 保护 整个 数据 结构 时 的 情况 ， 不 仅 可 能 会 有 更 多 对 锁 的 竞争 ， 也 会 
增加 锁 持 锁 的 时 间 。 较 多 的 操作 步骤 需要 获取 同一 个 互 斤 量 上 的 锁 ， 所 以 持 有 锁 的 时 间 会 更 
长 。 成 本 上 的 双重 打击 也 算是 为 向 细 粒 度 锁 转移 提供 了 双重 激励 和 可 能 。 


如 同上 面 的 例子 ， 锁 不 仅 是 能 锁 住 合适 粒度 的 数据 ， 还 要 控制 锁 的 持 有 时 间 ， 以 及 什么 操作 
在 执行 的 同时 能 够 拥有 锁 。 一 般 情 况 下 ， 执 行 必要 的 操作 时 ， 尽 可 能 将 持 有 锁 的 时 间 缩 减 到 
最 小 。 这 也 就 意味 有 一 些 浪费 时 间 的 操作 ， 比 如 : 获取 另外 一 个 锁 (即使 你 知道 这 不 会 造成 死 
锁 )， 或 等 待 输入 /输出 操作 完成 时 没有 必要 持 有 一 个 锁 ( 除 非 绝 对 需要 ) © 


清单 3.6 和 3.9 中 ， 交 换 操作 需要 锁 住 两 个 互 矿 量 ， 其 明确 要 求 并 发 访问 两 个 对 象 。 假 设 用 来 做 
比较 的 是 一 个 简单 的 数据 类 型 (比如 :int 类 型 )， 将 会 有 什么 不 同 么 ?int 的 拷贝 很 廉价 ， 所 以 可 
以 很 容易 的 进行 数据 复制 ， 并 且 每 个 被 比较 的 对 象 都 持 有 该 对 象 的 锁 ， 在 比较 之 后 进行 数据 
找 贝 。 这 就 意味 着 ， 在 最 短 时 间 内 持 有 每 个 互 斥 量 ， 并 且 你 不 会 在 持 有 一 个 锁 的 同时 再 去 获 
取 另 一 个 。 下 面 的 清单 中 展示 了 一 个 在 这 样 情景 中 的 Y 类 ， 并 且 展 示 了 一 个 相等 比较 运算 符 的 
等 价 实现 。 


列表 3.10 比较 操作 符 中 一 次 锁 住 一 个 互 斥 量 


class Y 
{ 
private: 
int some_detail; 
mutable std::mutex m; 
int get_detail() const 
{ 
std::lock_guard<std::mutex> lock_a(m); // 1 
return some_detail; 
} 
public: 
Y(int sd):some_detail(sd){} 


friend bool operator==(Y const& lhs, Y const& rhs) 
{ 
if (&lhs==&rhs ) 
return true; 
int const lhs_value=lhs.get_detail(); // 2 
int const rhs_value=rhs.get_detail(); // 3 
return lhs_value==rhs_value; // 4 


} 
和 


在 这 个 例子 中 ， 比 较 操作 符 首先 通过 调用 get_detail() 成 员 函 数 检 索要 比较 的 值 @@， 函 数 在 索 
引 值 时 被 一 个 锁 保护 着 @@。 比 较 操作 符 会 在 之 后 比较 索引 出 来 的 值 @。 注 意 : 虽然 这 样 能 减少 
锁 持 有 的 时 间 ， 一 个 锁 只 持 有 一 次 (这 样 能 消除 死 锁 的 可 能 性 )， 这 里 有 一 个 微妙 的 语义 操作 同 
时 对 两 个 锁 住 的 值 进行 比较 。 


列表 3.10 中 ， 当 操作 符 返 回 true 时 ， 那 就 意味 着 在 这 个 时 间 点 上 的 Ihs.some_detail 与 在 另 一 个 
时 间 点 的 rhs.some_detail 相 同 。 这 两 个 值 在 读 取 之 后 ， 可 能 会 被 任意 的 方式 所 修改 ; 两 个 值 
会 在 @ 和 四处 进行 交换 ， 这 样 就 会 失去 比较 的 意义 。 等 价 比 较 可 能 会 返回 true， 来 表明 这 两 个 
值 时 相等 的 ， 实 际 上 这 两 个 值 相等 的 情况 可 能 就 发 生 在 一 瞬间 。 这 样 的 变化 要 小 心 ， 语 义 操 
作 是 无 法 改变 一 个 问题 的 比较 方式 : 当 你 持 有 人 锁 的 时 间 没 有 达到 整个 操作 时 间 ， 就 会 让 自己 
处 于 条 件 竞争 的 状态 。 


有 时 ， 只 是 没有 一 个 合适 粒度 级 别 ， 因 为 并 不 是 所 有 对 数据 结构 的 访问 都 需要 同一 级 的 保 
护 。 这 个 例子 中 ， 就 需要 寻找 一 个 合适 的 机 制 ， 去 替换 std::mutex ° 
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3.3 保护 共 王 数据 的 替代 设施 


互 矿 量 是 最 通用 的 机 制 ， 但 其 并 非 保 护 共享 数据 的 唯一 方式 。 这 里 有 很 多 替代 方式 可 以 在 特 
定 情 况 下 ， 提 供 更 加 合适 的 保护 。 


一 个 特别 极端 (但 十 分 常见 ) 的 情况 就 是 ， 共 享 数据 在 并 发 访问 和 初始 化 时 (都 需要 保护 )， 但 是 
之 后 需要 进行 隐 式 同步 。 这 Oe 
为 必要 的 保护 作为 对 数据 操作 的 一 部 分 ， 所 以 隐 式 的 执行 。 任 何 情况 下 ， 数 据 初 始 化 后 锁 住 
一 个 互 斥 量 ， 纯 粹 是 为 了 保护 其 初始 化 过 程 (这 是 没有 必要 的 )， 并 且 这 会 给 性 能 带 来 不 必要 的 
冲击 。 出 于 以 上 的 原因 ， ct+ 标准 提供 了 一 种 纯粹 保护 共享 数据 初始 化 过 程 的 机 制 。 


3.3.1 保护 共享 数据 的 初始 化 过 程 


假设 你 与 一 个 共享 源 ， 构 建 代价 很 兄 贵 ,可 能 它 会 打开 一 个 数据 库 连接 或 分 配 出 很 多 的 内 存 。 


延迟 初始 化 (Lazy initialization) # ¥ 2 每 一 个 操作 都 需要 先 对 源 进 行 检查 ， 
为 了 了 解数 据 是 否 被 初始 化 ， 然 后 在 其 使 用 前 决定 ， 数 据 是 否 需 要 初始 化 : 





std::shared_ptr<some_resource> resource_ptr; 
void foo() 
{ 
if(!resource_ptr) 
if 
resource_ptr.reset(new some_resource); // 1 


} 


resource_ptr->do_something(); 
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换 会 使 得 线程 资源 产生 不 必要 的 序列 化 。 这 是 因为 每 个 线程 必须 等 待 互 斥 量 ， 为 了 确定 数据 
源 已 经 初始 化 了 。 


清单 3.11 使 用 一 个 互 斥 量 的 延迟 初始 化 (线程 安全 ) 过 程 


std::shared_ptr<some_resource> resource_ptr; 
std::mutex resource_mutex; 


void foo() 
{ 

std::unique_lock<std::mutex> 1k(resource_mutex); // 所 有 线程 在 
此 序列 化 

if(!resource_ptr) 

{ 

resource_ptr.reset(new some_resource); // 只 有 初始 化 过 程 需要 保 

护 

} 

lk.unlock(); 

resource_ptr->do_something(); 


这 段 代 码 相 当 常 见 了 ， 也 足够 表现 出 没 必 要 的 线程 化 问题 ， 很 多 人 能 想 出 更 好 的 一 些 的 办 法 
来 做 这 件 事 ， 包 括 声名 狼藉 的 双重 检查 锁 模式 : 


void undefined_behaviour_with_double_checked_locking() 
{ 
if(!resource_ptr) // 1 
{ 
std::lock_guard<std::mutex> 1k(resource_mutex); 
if(!resource_ptr) // 2 


{ 
resource_ptr.reset(new some_resource); // 3 
} 
} 
resource_ptr->do_something(); // 4 


指针 第 一 次 读 取 数 据 不 需要 获取 锁 四 ， 并 且 只 有 在 指针 为 NULL 时 才 需 要 获取 锁 。 然 后 ， 当 获 
取 锁 之 后 ， 指 针 会 被 再 次 检查 一 遍 @ (这 就 是 双重 检查 的 部 分 )， 避 免 另 一 的 线程 在 第 一 次 检查 
后 再 做 初始 化 ， 并 且 让 当前 线程 获取 锁 。 


这 个 模式 为 什么 声名 狼藉 呢 ?因为 这 里 有 潜在 的 条 件 竞争 ， 未 被 锁 保护 的 读 取 操 作 加 没有 与 其 
他 线程 里 被 锁 保 护 的 写 入 操作 回 进行 同步 。 因 此 就 会 产生 条 件 竞 争 ， 这 个 条 件 竞 争 不 仅 和 覆盖 指 
针 本 身 ， 还 会 影响 到 其 指向 的 对 象 ; 即使 一 个 线程 知道 另 一 个 线程 完成 对 指针 进行 写 入 ， 它 


可 能 没有 看 到 新 创建 的 some_ resource 实例 ， 然 后 调用 do_something()@ 后 ， 得 到 不 正确 的 结 
果 。 这 个 例子 是 在 一 种 典型 的 条 件 竞争 一 一 数据 竞争 ，ct+ 标准 中 这 就 会 被 指定 为 “未 定义 行 
o RATA 定 是 可 以 避免 的 。 可 以 阅读 第 5 章 ， 那 里 有 更 多 对 内 存 模型 的 讨论 ， 包 括 数据 


C++ 标 准 委员 会 也 认为 条 件 竞 争 的 处 理 很 重要 ， 所 以 C+t+ 标 准 库 提供 

了 std::once _flag 和 std::call_once 来 处 理 这 种 情况 。 比 起 锁 住 互 斥 量 ， 并 显 式 的 检查 指 
针 ， 每 个 线程 只 需要 使 用 std::call _ once ， 在 std::call_once 的 结束 时 ， 就 能 安全 的 知道 指 
针 已 经 被 其 他 的 线程 初始 化 了 。 使 用 std: :call_once 比 显 式 使 用 互 斤 量 消耗 的 资源 更 少 ， 特 
别 是 当初 始 化 完成 后 。 下 面 的 例子 展示 了 和 与 清单 3.11 中 的 同样 的 操作 ， 这 里 使 用 

了 std::call_once 。 在 这 种 情况 下 ， 初 始 化 通过 调用 函数 完成 ， 同 样 这 样 操作 使 用 类 中 的 函 
数 操作 符 来 实现 同样 很 简单 。 如 同 大 多 数 在 标准 库 中 的 函数 一 样 ， 或 作为 函数 被 调用 ， 或 作 
为 参数 被 传递 ， std::call_once 可 以 和 任何 函数 或 可 调用 对 得 一 起 使 用 。 


std::shared_ptr<some_resource> resource_ptr; 
std::once_flag resource_flag; // 1 


void init_resource() 


i 


resource_ptr.reset(new some_resource); 


void foo() 


{ 

std::call_once(resource_flag,init_resource); // 可 以 完整 的 进行 一 
次 初始 化 

resource_ptr->do_something(); 


在 这 个 例子 中 ， std::once flag @ 和 初始 化 好 的 数据 都 是 命名 空间 区 域 的 对 象 ， 但 
是 std::call_once() 可 仅 作 为 延迟 初始 化 的 类 型 成 员 ， 如 同 下 面 的 例子 一 样 : 


清单 3.12 使 用 std::call_once 作为 类 成 员 的 延迟 初始 化 (线程 安全 ) 


class X 

{ 

private: 
connection_info connection_details; 
connection_handle connection; 
std::once_flag connection_init_flag; 


void open_connection() 
{ 
connection=connection_manager .open(connection_details); 
} 
public: 
X(connection_info const& connection_details_): 
connection_details(connection_details_) 
{} 
void send_data(data_packet const& data) // 1 


{ 


std::call_once(connection_init_flag, &X::open_connection, this); 
/12 
connection.send_data(data); 
} 
data_packet receive_data() // 3 


{ 


std::call_once(connection_init_flag, &X::open_connection, this); 
和合 2 
return connection.receive_data(); 
} 
}; 


例子 中 第 一 个 调用 send_data()@ 或 receive _data()@ 的 线程 完成 初始 化 过 程 。 使 用 成 员 函 数 
open_connection() 去 初始 化 数据 ， 也 需要 将 this 指 针 传 进去 。 和 其 在 在 标准 库 中 的 函数 一 样 ， 
其 接受 可 调用 对 象 ， 比 如 std::thread 的 构造 函数 和 std::bind() ， 通 过 

向 std::call_once() @ 传 递 一 个 额外 的 参数 来 完成 这 个 操作 。 


值得 注意 的 是 ， std::mutex 和 std::one_flag 的 实例 就 不 能 拷贝 和 移动 ， 所 以 当 你 使 用 它们 
作为 类 成 员 函 数 ， 如 果 你 需要 用 到 他 们 ， 你 就 得 显示 定义 这 些 特殊 的 成 员 兄 数 。 


ae 种 情形 的 初始 化 过 程 中 潜 存 着 条 件 竞 争 : 其 中 一 个 局 部 变量 被 声明 为 static 类 型 。 这 种 
o e 成 初始 化 ; 对 于 多 线程 调用 的 函数 ， 这 就 意 Aon 

这 个 变量 。 在 很 多 在 前 C++11 编 译 器 ( 译 者 : 不 支持 C++11 标 准 的 编译 器 )， 

Pee OUR mn 因为 在 多 线程 中 ， es 

个 初始 化 这 个 变量 线程 ; 或 一 个 线程 对 变量 进行 初始 化 ， 而 另外 一 个 线程 要 使 用 这 个 变量 

时 ， 和 初始 化 过 程 还 没完 成 。 Fe re ， onan ee: 初始 化 及 定义 完全 在 一 个 

线程 中 发 生 ， 并 且 没 有 其 他 线程 可 在 初始 化 完成 前 对 其 进行 处 理 ， 条 件 竞争 终止 于 初始 化 阶 

段 ， 这 样 比 在 之 后 再 去 处 理 好 的 多 。 在 只 需要 一 个 全 局 实例 情况 下 ， 这 里 提供 一 

个 std::call_once 的 替代 方案 





class my_class; 

my_class& get_my_class_instance() 

{ 
static my_class instance; // 线程 安全 的 初始 化 过 程 
return instance; 
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对 于 很 少 有 更 新 的 数据 结构 来 说 ， 只 在 初始 化 时 保护 数据 。 在 大 多 数 情况 下 ， 这 种 数据 结构 
是 只 读 的 ， 并 且 多 线程 对 其 并 发 的 读 取 也 是 很 愉快 的 ， 不 过 一 旦 数据 结构 需要 更 新 ， 就 会 产 
生 竞 争 。 


3.3.2 保护 很 少 更 新 的 数据 结构 


试想 ， 为 了 将 域名 解析 为 其 相关 IP 地 址 ， 我 们 在 缓存 中 的 存放 了 一 张 DNS 入 口 表 。 通 常 ， 给 
定 DNS 数 目 在 很 长 的 一 段 时 间 内 保持 不 变 。 虽 然 ， 在 用 户 访问 不 同 网 站 时 ， 新 的 入 口 可 能 会 
被 添加 到 表 中 ， 但 是 这 些 数据 可 外 pees 周期 内 保持 不 变 。 所 以 定期 检查 缓存 中 入 口 的 有 
效 性 ， 就 变 的 十 分 重要 了 ; 但 是 ， 这 也 需要 一 次 更 新 ， 也 许 这 次 更 新 只 是 对 一 些 细节 做 了 改 
动 。 


虽然 更 新 频 度 很 低 ， 但 更 新 也 有 可 能 发 生 ， 并 且 当 这 个 可 缓存 被 多 个 线程 访问 ， 这 个 缓存 就 
需要 处 于 更 新 状态 时 得 到 保护 ， 这 也 为 了 确保 每 个 线程 读 到 都 是 有 效 数据 。 


没有 使 用 专用 数据 结构 时 ， 这 种 方式 是 符合 预期 ， 并 且 为 并 发 更 新 和 读 取 特别 设计 的 (更 多 的 
例子 在 第 6 和 第 7 章 中 介绍 )。 这 样 的 更 新 要 求 线 程 独 占 数 据 结 构 的 访问 权 ， 直 到 其 完成 更 新 操 
作 。 当 更 新 完成 ， 数 据 结 构 对 于 并 发 多 线程 访问 又 会 是 安全 的 。 使 用 std::mutex 来 保护 数据 
结构 ， 显 的 有 些 反应 过 度 ( 因 为 在 没有 发 生 修改 时 ， 它 将 削减 并 发 读 取 数据 的 可 能 性 )。 这 里 需 
要 另 一 种 不 同 的 互 斥 量 ， 这 种 互 斥 量 常 被 称 为 “读者 -作者 锁 ”， 因 为 其 允许 两 种 不 同 的 使 用 方 
式 : 一 个 “作者 "线程 独占 访问 和 共享 访问 ， 让 多 个 “读者 "线程 并 发 访问 。 
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量 [3]。 因 为 建议 没有 被 采纳 ， 这 个 例子 在 本 节 中 使 用 的 是 Boost 库 提供 的 实现 (Boost 采 纳 了 这 
个 建议 )。 你 将 在 第 8 章 中 看 到 ， 这 种 锁 的 也 不 能 包 治 百 病 ， 其 性 能 依赖 于 参与 其 中 的 处 理 器 数 
量 ， 同 样 也 与 读者 和 作者 线程 的 负载 有 关 。 为 了 确保 增加 复杂 度 后 还 能 获得 性 能 收益 ， 目 标 
系统 上 的 代码 性 能 就 很 重要 。 


比 起 使 用 std::mutex 实例 进行 同步 ， 不 如 使 用 boost::shared_mutex 来 做 同步 。 对 于 更 新 操 
作 ， 可 以 使 

用 std: : lock_guard<boost: : shared_mutex> 和 std: :unique_lock<boost: :shared_mutex> 上 人 锁 。 作 
为 std::mutex 的 蔡 代 方案 ， 与 std::mutex 所 做 的 一 样 ， 这 就 能 保证 更 新 线程 的 独占 访问 。 
为 其 他 线程 不 需要 去 修改 数据 结构 ， 所 以 其 可 以 使 

用 boost::shared_lock<boost::shared_mutex> 获取 访问 权 。 这 与 使 用 std: :unique_lock 一 样 ， 
人 boost::shared_mutex 上 有 共享 锁 。 唯 一 的 限制 : 当 任 一 线程 
拥有 一 个 共享 锁 时 ， 这 个 线程 就 会 尝试 获取 一 个 独占 锁 ， 直 到 其 他 线程 放弃 他 们 的 锁 ; 同样 
的 ， 当 任 一 线程 拥有 一 个 独占 锁 时 ， 其 他 线程 就 无 法 获得 共享 锁 或 独占 锁 ， 直 到 第 一 个 线程 
放弃 其 拥有 的 锁 。 


如 同 之 前 描 述 的 那样 ， 下 面 的 代码 ; “Fy 青 单 展示 T 一 个 简 单 的 DNS 缓存 ， 使 用 std: :map 持 有 缓存 
数据 ， 使 用 boost: :shared_mutex 进行 保护 


清单 3.13 使 用 boost: :shared_mutex 对 数据 结构 进行 保护 


#include <map> 

#include <string> 

#include <mutex> 

#include <boost/thread/shared_mutex.hpp> 


class dns_entry; 


class dns_cache 
{ 
std::map<std::string,dns_entry> entries; 
mutable boost::shared_mutex entry_mutex; 
public: 
dns_entry find_entry(std::string const& domain) const 


{ 


boost: :shared_lock<boost: :shared_mutex> lk(entry_mutex); // 


std: :map<std::string,dns_entry>::const_iterator const it= 
entries.find(domain); 
return (it==entries.end())?dns_entry():it->second; 
} 
void update_or_add_entry(std::string const& domain, 
dns_entry const& dns_details) 


std::lock_guard<boost::shared_mutex> lk(entry_mutex); // 2 
entries[domain]=dns_details; 
} 
}; 


清单 3.13 中 ，find_entry() 使 用 boost::shared_lock<> 来 保护 共享 和 只 读 权 限 @ ; 这 就 使 得 多 线 
程 可 以 同时 调用 find_entry()， 且 不 会 出 错 。 另 一 方面 ，update_ or _ add_entry() 使 

用 std::lock_guard<> 实例 ， 当 表格 需要 更 新 时 @@， 为 其 提供 独占 访问 权限 ; 
update_ or_ add _entry() 函 数 调 用 时 ， 独 占 锁 会 阻止 其 他 线程 对 数据 结构 进行 修改 ， 并 且 阻 目 
线程 调用 find_entry()。 


3.3.3 ik BiAil 


当 一 个 线程 已 经 获取 一 个 std: :mutex 时 (已 经 上 锁 )， 并 对 其 再 次 上 锁 ， 这 个 操作 就 是 错误 
的 ， 并 且 继 续 党 试 这 样 做 的 话 ， 就 会 产生 未 定义 行为 。 然 而 ， 在 菜 些 情况 下 ， 一 个 线程 尝试 
获取 同一 个 互 不 量 多 次 ， 而 没有 对 其 进行 一 次 释放 是 可 以 的 。 之 所 以 可 以 ， 是 因为 c++ 标准 


库 提 供 了 std::recursive_mutex 类 。 其 功能 与 std::mutex 类 似 ， 除 了 你 可 以 从 同一 线程 的 单 
个 实例 上 获取 多 个 锁 。 互 斥 量 锁 住 其 他 线程 前 ， 你 必须 释放 你 拥有 的 所 有 锁 ， 所 以 当 你 调用 
lock() 三 次 时 ， 你 也 必须 调用 unlock() 三 次 。 正 确 使 

用 std: :lock_guard<std::recursive_mutex> 和 std: :unique_lock<std: :recursive_mutex> 可 以 帮 


你 处 理 这 些 问题 。 


大 多 数 情况 下 ， 当 你 需要 诺 套 锁 时 ， 就 要 对 你 的 设计 进行 改动 。 诅 套 锁 一 般 用 在 可 并 发 访问 
的 类 上 ， 所 以 其 拥 互 斥 量 保 护 其 成 员 数 据 。 每 个 公共 成 员 函 数 都 会 对 互 斥 量 上 锁 ， 然 后 完成 
对 应 的 功能 ， 之 后 再 解锁 互 斥 量 。 不 过 ， 有 时 成 员 遂 数 会 调用 另 一 个 成 员 汶 数 ， 这 种 情况 

下 ， 第 二 个 成 员 通 数 也 会 试图 锁 住 互 斥 量 ， 这 就 会 导致 未 定义 行为 的 发 生 。" 变 通 的 "解决 方案 
会 将 互 斥 量 转 为 能 套 锁 ， 第 二 个 成 员 也 数 就 能 成 功 的 进行 上 锁 ， 并 且 有 函数 能 继续 执行 。 


但 是 ， 这 样 的 使 用 方式 是 不 推荐 的 ， 因 为 其 过 于 草率 ， 并 且 不 合理 。 特 别 是 ， 当 锁 被 持 有 
时 ， 对 应 类 的 不 变量 通常 正在 被 修改 。 这 意味 着 ， 当 不 变量 正在 改变 的 时 候 ， 第 二 个 成 员 函 
数 还 需要 继续 执行 。 一 个 比较 好 的 方式 是 ， 从 中 提取 出 一 个 取 数 作为 类 的 私有 成 员 ， 并 且 让 
其 他 成 员 函 数 都 对 其 进行 调用 ， 这 个 私有 成 员 函 数 不 会 对 互 斥 量 进行 上 锁 (在 调用 前 必须 获得 
Bh) 。 然 后 ， 你 仔细 考虑 一 下 ， 在 这 种 情况 调用 新 函数 时 ， 数 据 的 状态 。 


[3] Howard E. Hinnant, “Multithreading API for C++OX—A Layered Approach,” C++ 
Standards Committee Paper N2094, http://www.open- 
std.org/jtc1/sc22/wg21/docs/papers/2006/n2094.html. 


3.4 本 章 总 结 


本 章 讨 论 了 当 两 个 线程 间 的 共享 数据 发 生 恶性 条 件 竞争 会 带 来 多 人 么 严重 的 灾难 ， 还 讨论 了 如 
何 使 用 std::mutex ， 和 如 何 避 免 这 些 问 题 。 如 你 所 见 ， 互 乒 量 并 不 是 灵丹妙药 ， 其 还 有 自己 
的 问题 (比如 : 死 锁 )， 虽 然 C++ 标准 库 提 供 了 一 类 工具 来 避免 这 些 (例如 : std::lock() )。 你 
还 见识 了 一 些 用 于 避免 死 锁 的 先进 技术 ， 之 后 了 解 了 锁 所 有 权 的 转移 ， 以 及 一 些 围绕 如 何 选 
取 适 当 粒 度 锁 产 生 的 问题 。 最 后 ， 讨 论 了 在 具体 情况 下 ， 数 据 保护 的 蔡 代 方案 ， 例 


he: std: :call_once() 和 boost::shared_mutex ° 


还 有 一 个 方面 没有 涉及 到 ， 那 就 是 等 待 其 他 线程 作为 输入 的 情况 。 我 们 的 线程 安全 栈 ， 仅 是 
在 栈 为 空 时 ， 抛 出 一 个 异常 ， 所 以 当 一 个 线程 要 等 待 其 他 线程 向 栈 压 入 一 个 值 时 (这 是 一 个 线 
oe 全 栈 的 主要 用 途 之 一 )， 它 不 得 不 多 次 尝试 去 弹出 一 个 值 ， 当 捕获 抛 出 的 异常 时 ， 再 次 进 

尝试 。 这 种 消耗 资源 的 检查 ， 没 有 任何 意义 。 并 且 ， 不 断 的 检查 会 影响 系统 中 其 他 线程 的 
这 反而 会 妨碍 程序 的 进展 。 我 们 WO 74 
在 等 待 过 程 中 不 占用 CPU。 第 4 章 中 ， 会 去 建立 一 些 工具 ， 用 于 保护 共享 数据 ， 还 会 介绍 一 些 
线程 同步 操作 的 机 制 ; 第 6 章 中 ， 如 何 构建 更 大 型 的 可 复 用 的 数据 类 型 。 


PAF 同步 并 发 操作 


本 章 主 要 内 容 

o 等 待 事件 

e 带 有 期 望 的 等 待 一 次 性 事件 

0 在 限定 时 间 内 等 待 

。 使 用 同步 操作 简化 代码 
在 上 一 章 中 ， 我 们 看 到 各 种 在 线程 间 保 护 共 享 数 据 的 方法 。 当 你 不 仅 想 要 保护 数据 ， 还 想 对 
单独 的 线程 进行 同步 。 例 如 ， 在 第 一 个 线程 完成 前 ， 可 能 需要 等 待 另 一 个 线程 执行 完成 。 通 
常情 况 下 ， 线 程 会 等 待 一 个 特定 事件 的 发 生 ， 或 者 等 待 某 一 条 件 达 成 (为 true)。 这 可 能 需要 定 
期 检查 “任务 完成 "标识 ， 或 将 类 似 的 东西 放 到 共享 数据 中 ， 但 这 与 理想 情况 还 是 差 很 多 。 像 这 
种 情况 就 需要 在 线程 中 进行 同步 ， c++ 标准 库 提供 了 一 些 工 具 可 用 于 同步 操作 ， 形 式 上 表现 
为 条 件 变量 (condition variables)# #1 % (futures) ° 


在 本 章 ， 将 讨论 如 何 使 用 条 件 变量 等 竺 事件， 以 及 介绍 期 望 ， 和 如 何 使 用 它 简 化 同步 操作 。 


4.1 等 待 一 个 事件 或 其 他 条 件 


假设 你 在 旅游 ， 而 且 正 在 一 辆 在 夜间 运行 的 火车 上 。 在 夜间 ， 如 何在 正确 的 站 点 下 车 呢 ? 一 
种 方法 是 整 晚 都 要 醒 着 ， 然 后 注意 到 了 哪 一 站 。 这 样 ， 你 就 不 会 错过 你 要 到 达 的 站 点 ， 但 是 

这 样 会 让 你 感到 很 疲倦 。 另 外 ， 你 可 以 看 一 下 时 间 表 ， 估 计 一 下 火车 到 达 目 的 地 的 时 间 ， 然 
后 在 一 个 稍 旱 的 时 间 点 上 设置 闵 铃 ， 然 后 你 就 可 以 安心 的 睡 会 了 。 这 个 方法 听 起 来 也 很 不 

错 ， 也 没有 错过 你 要 下 车 的 站 点 ， 但 是 当 火 车 晚点 的 时 候 ， 你 就 要 被 过 早 的 叫 醒 了 。 当 然 ， 
闵 钟 的 电池 也 可 能 会 没 电 了 ， 并 导致 你 睡 过 站 。 理 想 的 方式 是 ， 无 论 是 早 或 晚 ， 只 要 当 火 车 
到 站 的 时 候 ， 有 人 或 其 他 东西 能 把 你 唤醒 ， 就 好 了 。 


这 和 线程 有 什么 关系 呢 ? 好 吧 ， 让 我 们 来 联系 一 下 。 当 一 个 线程 等 待 另 一 个 线程 完成 任务 
时 ， 它 会 有 很 多 选择 。 第 一 ， 它 可 以 持续 的 检查 共享 数据 标志 (用 于 做 保护 工作 的 互 斥 量 )， 直 
到 另 一 线程 完成 工作 时 对 这 个 标志 进行 重 设 。 不 过 ， 就 是 一 种 浪费 : 线程 消耗 宝贵 的 执行 时 
间 持 续 的 检查 对 应 标志 ， 并 且 当 互 斥 量 被 等 待 线程 上 锁 后 ， 其 他 线程 就 没有 办 法 获取 锁 ， 这 
样 线程 就 会 持续 等 待 。 因 为 以 上 方式 对 等 待 线 程 限 制 资源 ， 并 且 在 完成 时 阻碍 对 标识 的 设 

置 。 这 种 情况 类 似 与 ， 保 持 清醒 状态 和 列车 驾驶 员 聊 了 一 晚上 : 驾驶 员 不 得 不 缓慢 驾驶 ， 因 
为 你 分 散 了 他 的 注意 力 ， 所 以 火车 需要 更 长 的 时 间 ， 才 能 到 站 。 同 样 的 ， 等 待 的 线程 会 等 待 
更 长 的 时 间 ， 这 些 线程 也 在 消耗 着 系统 资源 。 


第 二 个 选择 是 在 等 待 线程 在 检查 间隙 ， 使 用 std::this_thread::sleep_for() 进行 周期 性 的 间歇 
( 详 见 4.3 节 ) : 


bool flag; 
std::mutex m; 


void wait_for_flag() 
{ 
std::unique_lock<std::mutex> lk(m); 
while(! flag) 
{ 
lk.unlock(); // 1 REFE 
std::this_thread::sleep_for(std::chrono::milliseconds(100)); 
// 2 休眠 100ms 
1k.lock(); // 3 再 锁 互 不 量 


这 个 循环 中 ， 在 休眠 前 四 ， 郊 数 对 互 斥 量 进行 解锁 加， 并 且 在 休 眼 结束 后 再 对 互 斥 量 进行 上 
锁 ， 所 以 另外 的 线程 就 有 机 会 获取 锁 并 设置 标识 。 


这 个 实现 就 进步 很 多 ， 因 为 当 线程 休眠 时 ， 线 程 没有 浪费 执行 时 间 ， 但 是 很 难 确定 正确 的 休 
眠 时 间 。 太 短 的 休眠 和 没有 休眠 一 样 ， 都 会 浪费 执行 时 间 ; 太 长 的 休眠 时 间 ， 可 能 会 让 任务 
等 待 线 程 醒 来 。 休 眠 时 间 过 长 是 很 少见 的 情况 ， 因 为 这 会 直接 影响 到 程序 的 行为 ， 当 在 高 节 
奏 游 戏 中 ， 它 意味 着 丢 帧 ， 或 在 一 个 实时 应 用 中 超越 了 一 个 时 间 片 。 


第 三 个 选择 (也 是 优先 的 选择 ) 是 ， 使 用 C++ 标准 库 提供 的 工具 去 等 待 事件 的 发 生 。 通 过 另 一 线 
程 触 发 等 待 事件 的 机 制 是 最 基本 的 唤醒 方式 (例如 : 流水 线 上 存在 额外 的 任务 时 )， 这 种 机 制 就 
称 为 “条 件 变 量 "。 从 概念 上 来 说 ， 一 个 条 件 变 量 会 与 多 个 事件 或 其 他 条 件 相 关 ， 并 且 一 个 或 多 
个 线程 会 等 待 条 件 的 达成 。 当 某 些 线程 被 终止 时 ， 为 了 唤醒 等 待 线程 (允许 等 待 线程 继续 执行 ) 
终止 的 线程 将 会 向 等 待 着 的 线程 广播 "条 件 达成 "的 信息 。 


4.1.1 等 待 条 件 达成 


C++ 标准 库 对 条 件 变 量 有 两 套 实 

现 : std::condition_variable 和 std: :condition_variable_any ° 这 两 个 实现 都 包含 

在 <condition_variable> 头 文件 的 声明 中 。 两 者 都 需要 与 一 个 互 斥 量 一 起 才能 工作 ( 互 斥 量 是 
为 了 同步 ) ; 前 者 仅 限 于 与 std::mutex 一 起 工作 ， 而 后 者 可 以 和 任何 满足 最 低 标准 的 互 斤 量 一 
起 工作 ， 从 而 加 上 了 _any 的 后 缓 。 因 为 std::condition_variable_any 更 加 通用 ， 这 就 可 能 从 
体积 、 性 能 ， 以 及 系统 资源 的 使 用 方面 产生 额外 的 开销 ， 所 以 std::condition_variable 一 般 
作为 首选 的 类 型 ， 当 对 灵活 性 有 硬性 要 求 时 ， 我 们 才 会 去 考 


K std::condition_variable_any ° 


所 以 ， 如 何 使 用 std::condition_variable 去 处 理 之 前 提 到 的 情况 当 有 数据 需要 处 理 时 ， 
如 何 唤醒 休眠 中 的 线程 对 其 进行 处 理 ? 以 下 清单 展示 了 一 种 使 用 条 件 变量 做 唤醒 的 方式 。 





清单 4.1 使 用 std::condition_variable 处 理 数据 等 待 


std::mutex mut; 
std: :queue<data_chunk> data_queue; // 1 
std::condition_variable data_cond; 


void data_preparation_thread() 
{ 
while(more_data_to_prepare() ) 
{ 
data_chunk const data=prepare_data(); 
std::lock_guard<std: :mutex> 1k(mut); 
data_queue.push(data); // 2 
data_cond.notify_one(); // 3 


void data_processing_thread() 
{ 
while( true) 
{ 
std::unique lock<std: :mutex> 1k(mut); // 4 
data_cond.wait( 
1k, []{return !data_queue.empty();}); // 5 
data_chunk data=data_queue.front(); 
data_queue.pop(); 
1k.unlock(); // 6 
process(data); 
if(is_last_chunk(data) ) 
break; 


首先 ， 你 拥有 一 个 用 来 在 两 个 线程 之 间 传 递 数据 的 队列 @。 当 数据 准备 好 时 ， 使 

用 std::lock_guard 对 队列 上 人 锁 ， 将 准备 好 的 数据 压 入 队列 中 四 ， 之 后 线程 会 对 队列 中 的 数据 
上 人 锁 。 然 后 调用 std::condition_variable 的 notify_one() 成 员 兄 数 ， 对 等 待 的 线程 (如 果 有 等 待 
线程 ) 进 行 通知 国 。 


在 另外 一 侧 ， 你 有 一 个 正在 处 理 数 据 的 线程 ， 这 个 线程 首先 对 互 斥 量 上 锁 ， 但 在 这 

里 std::unique_lock 要 比 std::lock_guard 加 更 加 合适 一 一 且 听 我 细 细 道 来 。 线 程 之 后 会 调 
用 std::condition_variable 的 成 员 函数 wait() ， 传 递 一 个 锁 $e — ‘lambda & 2k RK N (1f A 等 
44 0 RAO) ° Lambda Bare c++11 WN ale > CT VIE EZ BAAR URAK 


的 一 部 分 ， 并 且 非 常 合适 作为 标准 函数 的 谓词 ， 例 如 wait() 函 数 。 在 这 个 例子 中 ， 简 单 的 
lambda 4 []{return !data_queue.empty();} 会 去 检查 data pny RAB? 3 
data_queue % A 2 HARANA) P CBR SRE T o it RANAS Y A Lambda% žk 
更 多 的 信息 。 





wait() 会 去 检查 这 些 条 件 (通过 调用 所 提供 的 lambda 部 数 )， 当 条 件 满足 (lambda 郊 数 返 回 true) 
时 返回 。 如 果 条 件 不 满足 (lambda 远 数 返 回 false)，wait() 驾 数 将 解锁 互 斥 量 ， 并 且 将 这 个 线程 
(上 上段 提 到 的 处 理 数据 的 线程 ) 置 于 阻塞 或 等 待 状态 。 当 准备 数据 的 线程 调用 notify_one() 通 知 
条 件 变量 时 ， 处 理 数 据 的 线程 从 睡眠 状态 中 苏醒 ， 重 新 获取 互 斤 锁 ， 并 且 对 条 件 再 次 检查 ， 
在 条 件 满足 的 情况 下 ， 卖 持 有 人 锁 。 当 条 件 不 满足 时 ， 线 程 将 对 互 斥 量 解锁 ， 
并 且 重 新 开始 等 待 9 这 就 是 为 什么 std: :unique_lock 而 不 使 用 std: : lock_guard 等 待 中 
的 线程 必须 在 等 待 期 间 解 锁 es ， 并 在 这 这 之 后 对 互 矿 量 再 次 上 锁 ， 而 std::lock_guard & 
有 这 么 灵活 。 如 果 互 斤 量 在 线程 休眠 期 间 保持 锁 住 状态 ， 准 备 数据 的 线程 将 无 法 锁 住 互 斥 
量 ， 也 无 法 添加 数据 到 队列 中 ; 同样 的 ， 等 待 线程 也 永远 不 会 知道 条 件 何 时 满足 。 





清单 4.1 使 用 了 一 个 简单 的 lambda 有 函数 用 于 等 待 @， 个 函数 用 于 检查 队列 何 时 不 为 空 ， 不 过 
任意 的 防 数 和 可 调用 对 得 都 可 以 传 入 wait()。 当 你 eee — 1S BRE BAER (RAF re 
单 中 简单 检查 要 复杂 很 多 )， 那 就 可 以 直接 将 这 个 函数 传 入 wait() ; 不 一 定 非 要 放 在 一 个 
lambda 表 达 式 中 。 在 调用 wait() 的 过 程 中 ， 一 个 条 件 变 量 可 能 会 去 检查 给 定 条 件 若干 次 ; 然 
而 ， 它 总 是 在 互 斥 量 被 锁定 时 这 样 做 ， 当 且 仅 当 提 供 测 试 条 件 的 函数 返回 true 时 ， 它 就 会 立即 

返回 。 当 等 待 线 程 重新 获取 互 斥 量 并 检查 条 件 时 ， 如 果 它 并 非 直 接 响应 另 一 个 线程 的 通知 ， 
这 就 是 所 谓 的 伪 唤 醒 (spurious wakeup)。 因 为 任何 伪 唤 醒 的 数量 和 频率 都 是 不 确定 的 ， 这 里 
不 建议 使 用 一 个 有 副作用 的 函数 做 条 件 检 查 。 当 你 这 样 做 了 ， 就 必须 做 好 多 次 产生 副作用 的 
心理 准备 。 


解锁 std: :unique_lock 的 灵活 性 ， 不 仅 适用 于 对 wait() 的 调用 ; 它 还 可 以 用 于 有 待 处 理 但 还 未 
处 理 的 数据 @。 处 理 数 据 可 能 是 一 个 耗 时 的 操作 ， 并 且 如 你 在 第 3 章 见 到 的 ， 你 就 知道 持 有 和 销 
的 时 间 过 长 是 一 个 多 么 糟糕 的 主意 。 


使 用 队列 在 多 个 线程 中 转移 数据 (如 清单 4.1) 是 很 常见 的 。 做 得 好 的 话 ， 同 步 操作 可 以 限制 在 
队列 本 身 ， 同 步 问 题 和 条 件 竞 争 出 现 的 概率 也 会 降低 。 鉴 于 这 些 好 处 ， 现 在 从 清单 4.1 中 提取 
出 一 个 通用 线程 安全 的 队列 。 


4.1.2 使 用 条 件 变 量 构建 线程 安全 队列 


当 你 正在 设计 一 个 通用 队列 时 ， 花 一 些 时 间 想 想 有 哪些 操作 需要 添加 到 队列 实现 中 去 ， 就 如 
之 前 在 3.2.3 节 看 到 的 线程 安全 的 栈 。 可 以 看 一 下 C++ 标准 库 提供 的 实现 ， 找 找 灵 
感 ; std::queue<> 容器 的 接口 展示 如 下 : 


清单 4.2 std: :queue 接口 


template <class T, class Container = std::deque<T> > 

class queue { 

public: 
explicit queue(const Container&); 
explicit queue(Container&& = Container()); 
template <class Alloc> explicit queue(const Alloc&); 
template <class Alloc> queue(const Container&, const Alloc&); 
template <class Alloc> queue(Container&&, const Alloc&); 
template <class Alloc> queue(queue&&, const Allocé&); 


void swap(queue& q); 


bool empty() const; 
size_type size() const; 


T& front(); 
const T& front() const; 
T& back(); 
const T& back() const; 


void push(const T& x); 

void push(T&& x); 

void pop(); 

template <class... Args> void emplace(Args&&... args); 


int 


当 你 忽略 构造 、 赋 值 以 及 交换 操作 时 ， 你 就 剩 下 了 三 组 操作 : 1. 对 整个 队列 的 状态 进行 查询 
(empty() 和 size());2. 查 询 在 队列 中 的 各 个 元 素 (front() 和 back()) ; 3. 修 改 队列 的 操作 (push()， 
pop() 和 emplace())。 这 就 和 3.2.3 中 的 栈 一 样 了 ， 因 此 你 也 会 遇 到 在 固有 接口 上 的 条 件 竞争 。 
因此 ， 你 需要 将 front() 和 pop() 合 并 成 一 个 函数 调用 ， 就 像 之 前 在 栈 实现 时 合并 top() 和 pop() 一 
样 。 与 清单 4.1 中 的 代码 不 同 的 是 : 当 使 用 队列 在 多 个 线程 中 传递 数据 时 ， 接 收 线程 通常 需要 
等 待 数据 的 压 入 。 这 里 我 们 提供 pop() 函 数 的 两 个 变种 : try_pop() 和 wait and_pop()。 
try_pop()， 尝 试 从 队列 中 弹出 数据 ， 总 会 直接 返回 ( 当 有 失败 时 )， 即 使 没有 值 可 检索 ; 

wait and_pop()， 将 会 等 待 有 值 可 检索 的 时 候 才 返回 。 当 你 使 用 之 前 栈 的 方式 来 实现 你 的 队 
列 ， 你 实现 的 队列 接口 就 可 能 会 是 下 面 这 样 : 


清单 4.3 线程 安全 队列 的 接口 


#include <memory> // 为 了 使 用 std: :shared_ptr 


template<typename T> 
class threadsafe_queue 
{ 
public: 
threadsafe_queue(); 
threadsafe_queue(const threadsafe_queue&) ; 
threadsafe_queue& operator=( 
const threadsafe_queue&) = delete; // 不 允许 简单 的 赋值 


void push(T new_value); 


bool try_pop(T& value); // 1 
std::shared_ptr<T> try_pop(); // 2 


void wait_and_pop(T& value); 
std::shared_ptr<T> wait_and_pop(); 


bool empty() const; 
}; 


就 像 之 前 对 栈 做 的 那样 ， 在 这 里 你 将 很 多 构造 函数 剪 掉 了 ， 并 且 禁 止 了 对 队列 的 简单 赋值 。 
和 之 前 一 样 ， 你 也 需要 提供 两 个 版 本 的 try_pop() 和 wait for_pop()。 第 一 个 重 载 的 try_pop()@ 
在 引用 变量 中 存储 着 检索 值 ， 所 以 它 可 以 用 来 返回 队列 中 值 的 状态 ; 当 检 索 到 一 个 变量 时 ， 
他 将 返回 true， ene ABE TALT) 第 二 个 重 载 @ 就 不 能 做 这 样 了 ， 因 为 它 是 用 来 直 
接 返回 检索 值 的 。 当 没有 值 可 检索 时 ， 这 个 函数 可 以 返回 NULL 指 针 。 


那么 问题 来 了 ， 如 何 将 以 上 这 些 和 清单 4.1 中 的 代码 相关 联 呢 ? 好 吧 ， 我 们 现在 就 来 看 看 怎么 
去 关联 。 你 可 以 从 之 前 的 代码 中 提取 push() 和 wait and_pop()， 如 以 下 清单 所 示 。 


清单 4.4 从 清单 4.1 中 提取 push() 和 wait and_pop() 


#include <queue> 
#include <mutex> 
#include <condition variable> 


template<typename T> 
class threadsafe_queue 


{ 


private: 
std::mutex mut; 
std::queue<T> data_queue; 
std::condition_variable data_cond; 
public: 
void push(T new_value) 
{ 
std: :lock_guard<std: :mutex> lk(mut); 
data_queue.push(new_value); 
data_cond.notify_one(); 


void wait_and_pop(T& value) 

{ 
std: :unique_lock<std::mutex> lk(mut); 
data_cond.wait(1k, [this]{return !data_queue.empty();}); 
value=data_queue.front(); 
data_queue.pop(); 

} 

}; 


threadsafe_queue<data_chunk> data_queue; // 1 


void data_preparation_thread() 
{ 
while(more_data_to_prepare() ) 
{ 
data_chunk const data=prepare_data(); 
data_queue.push(data); // 2 


void data_processing_thread() 
{ 
while(true) 
{ 
data_chunk data; 
data_queue.wait_and_pop(data); // 3 
process(data); 
if(is_last_chunk(data)) 
break; 


线程 队列 的 实例 中 包含 有 互 斥 量 和 条 件 变 量 ， 所 以 独立 的 变量 就 不 需要 了 @， 并 且 调 用 push() 
也 不 需要 外 部 同步 @。 当 然 ，wait and _pop() 还 要 兼顾 条 件 变量 的 等 待 @。 


另 一 个 wait and_pop() 函 数 的 重 载 写 起 来 就 很 琐碎 了 ， 剩 下 的 函数 就 像 从 清单 3.5 实 现 的 栈 中 
一 个 个 的 粘 过 来 一 样 。 最 终 的 队列 实现 如 下 所 示 。 


清单 4.5 使 用 条 件 变量 的 线程 安全 队列 (完整 版 ) 


#include <queue> 

#include <memory> 

#include <mutex> 

#include <condition_variable> 


template<typename T> 
class threadsafe_queue 
{ 
private: 
mutable std::mutex mut; // 1 互 不 量 必须 是 可 变 的 
std::queue<T> data_queue; 
std::condition_variable data_cond; 
public: 
threadsafe_queue() 
{} 
threadsafe_queue(threadsafe_queue const& other) 
{ 
std: :lock_guard<std: :mutex> lk(other.mut); 
data_queue=other .data_queue; 


void push(T new_value) 


{ 
std::lock_guard<std::mutex> 1k(mut); 


data_queue.push(new_value) ; 
data_cond.notify_one(); 


void wait_and_pop(T& value) 


i 


std::unique_lock<std: :mutex> lk(mut); 
data_cond.wait(1k, [this]{return !data_queue.empty();}); 
value=data_queue.front(); 

data_queue.pop(); 


std::shared_ptr<T> wait_and_pop() 

{ 
std: :unique_lock<std::mutex> 1lk(mut); 
data_cond.wait(lk,[this]{return !data_queue.empty();}); 
std::shared_ptr<T> res(std::make_shared<T> 

(data_queue.front())); 

data_queue.pop(); 
return res; 


bool try_pop(T& value) 

{ 
std::lock_guard<std: :mutex> 1k(mut); 
if(data_queue.empty() ) 

return false; 

value=data_queue.front(); 
data_queue.pop(); 
return true, 


std::shared_ptr<T> try_pop() 
{ 
std: :lock_guard<std::mutex> lk(mut); 
if(data_queue.empty() ) 
return std::shared_ptr<T>(); 
std::shared_ptr<T> res(std::make_shared<T> 
(data_queue.front())); 
data_queue.pop(); 
return res; 


bool empty() const 


{ 
std::lock_guard<std: :mutex> 1k(mut); 


return data_queue.empty(); 


} 
}; 


empty() 是 一 个 const 成 员 遂 数 ， 并 且 传 入 拷贝 构造 函数 的 other 形 参 是 一 个 const 引 用 ; 因为 其 
他 线程 可 能 有 这 个 类 型 的 非 const 引 用 对 象 ， 并 调用 变种 成 员 函 数 ， 所 以 这 里 有 必要 对 互 斥 量 
上 人 锁 。 如 果 锁 住 互 矿 量 是 一 个 可 变 操作 ， 那 么 这 个 互 斥 量 对 象 就 会 标记 为 可 变 的 四 ， 之 后 他 就 
可 以 在 empty() 和 拷贝 构造 函数 中 上 锁 了 。 


条 件 变量 在 多 个 线程 等 待 同一 个 事件 时 ， 也 是 很 有 用 的 。 当 线程 用 来 分 解 工作 负载 ， 并 且 只 
有 一 个 线程 可 以 对 通知 做 出 反应 ， 与 清单 4.1 中 使 用 的 结构 完全 相同 ; 运行 多 个 数据 实例 一 一 
处 理 线程 (processing thread)。 当 新 的 数据 准备 完成 ， 调 用 notify_one() 将 会 触发 一 个 正在 执行 
wait() 的 线程 ， 去 检查 条 件 和 wait() 驾 数 的 返回 状态 (因为 你 仅 是 向 data_queue 添 加 一 个 数据 
项 )。 这 里 不 保证 线程 一 定 会 被 通知 到 ， 即 使 只 有 一 个 等 待 线程 被 通知 时 ， 所 有 处 线程 也 有 可 
能 都 在 处 理 数 据 。 


另 一 种 可 能 是 ， 很 多 线程 等 待 同一 事件 ， 对 于 通知 他 们 都 需要 做 出 回应 。 这 会 发 生 在 共享 数 
据 正 在 初始 化 的 时 候 ， 当 处 理 线程 可 以 使 用 同一 数据 时 ， 就 要 等 待 数据 被 初始 化 (有 不 错 的 机 
制 可 用 来 应 对 ; 可 见 第 3 章 ，3.3.1 节 )， 或 等 待 共享 数据 的 更 新 ， 比 如 ， 定 期 重新 初始 化 
(periodic reinitialization)。 在 这 些 情况 下 ， 准 备 线程 准备 数据 数据 时 ， 就 会 通过 条 件 变 量 调用 
notify_all() 成 员 函 数 ， 而 非 直接 调用 notify_one() 函 数 。 顾 名 思 义 ， 这 就 是 全 部 线程 在 都 去 执行 
wait()( 检 查 他 们 等 待 的 条 件 是 否 满足 ) 的 原因 。 


当 等 待 线 程 只 等 待 一 次 ， 当 条 件 为 true 时 ， 它 就 不 会 再 等 待 条 件 变 量 了 ， 所 以 一 个 条 件 变量 可 
能 并 非 同 步 机 制 的 最 好 选择 。 尤 其 是 ， 条 件 在 等 待 一 组 可 用 的 数据 块 时 。 在 这 样 的 情况 下 ， 
期 望 (future) 就 是 一 个 适合 的 选择 。 


4.2 使 用 期 望 等 待 一 次 性 事件 


假设 你 乘 飞机 去 国外 度假 。 当 你 到 达 机 场 ， 并 且 办 理 完 各 种 登 机 手续 后 ， 你 还 需要 等 待机 场 
广播 通知 你 登 机 ， 可 能 要 等 很 多 个 小 时 。 你 可 能 会 在 候 机 室 里 面 找 一 些 事情 来 打发 时 间 ， 比 
如 : 读书， 上网， 或 者 来 一 杯 价格 不 菲 的 机 场 咖 啡 ， 不 过 从 根本 上 来 说 你 就 在 等 待 一 件 事 
情 : 机 场 广播 能 够 登 机 的 时 间 。 给 定 的 飞机 班次 再 之 后 没有 可 参考 性 ; 当 你 在 再 次 度假 的 时 
候 ， 你 可 能 会 等 待 另 一 班 飞机 。 


c++ 标准 库 模型 将 这 种 一 次 性 事件 称 为 期 望 (future)。 当 一 个 线程 需要 等 待 一 个 特定 的 一 次 性 
事件 时 ， 在 某 种 程度 上 来 说 它 就 需要 知道 这 个 事件 在 未 来 的 表现 形式 。 之 后 ， 这 个 线程 会 周 

期 性 ( 较 短 的 周期 ) 的 等 待 或 检查 ， 事 件 是 否 触 发 (检查 信息 板 ) ; 在 检查 期 间 也 会 执行 其 他 任务 
(品尝 昂贵 的 咖啡 )。 另 外 ， 在 等 待 任务 期 间 它 可 以 先 执行 另外 一 些 任务 ， 直 到 对 应 的 任务 能 

Bo aa FAIL RS HEH Hae ready) 。 一 个 “期望 "可 能 是 数据 相关 的 (比如 ， 你 的 登 机 
口 编号 )， 也 可 能 不 是 。 当 事件 发 生 时 (并 且 期 望 状态 为 就 绪 )， 这 个 “期望 "就 不 能 被 重 置 。 


在 C++ 标 准 库 中 ， 有 两 种 "期望 *， 使 用 两 种 类 型 模板 实现 ， 声 明 在 头 文件 中 : 唯一 期 望 (unique 
futures)( std::future<> ) 和 共享 期 望 (shared futures)( std::shared_future<> )。 这 是 仿 

照 std: :unique_ptr 和 std: :shared_ptr ° std::future 的 实例 只 能 与 一 个 指 定 事件 相 关联 ， 
而 std::shared_future 的 实例 就 能 关联 多 个 事件 。 后 者 的 实现 中 ， 所 有 实例 会 在 同时 变 为 就 
绪 状 态 ， 并 且 他 们 可 以 访问 与 事件 相关 的 任何 数据 。 这 种 数据 关联 与 模板 有 关 ， 比 

如 std: :unique_ptr 和 std: :shared_ptr 的 模板 参数 就 是 相关 联 的 数据 类 型 。 在 与 数据 无 关 的 
地 方 ， 可 以 使 用 std::future<void> 与 std::shared_future<void> 的 特 化 模板 。 虽 然 ， 我 希望 
用 于 线程 间 的 通讯 ， 但 是 “期望 "对 象 本 身 并 不 提供 同步 访问 。 当 多 个 线程 需要 访问 一 个 独 

立 “ 期 望 " 对 象 时 ， 他 们 必须 使 用 互 扩 量 或 类 似 同 步 机 制 对 访问 进行 保护 ， 如 在 第 3 章 提 到 的 那 
样 。 不 过 ， 在 你 将 要 阅读 到 的 4.2.5 节 中 ， 多 std::shared_future<> 实例 的 副 
本 进行 访问 ， 而 不 需要 期 望 同步 ， 即 使 他 们 是 同一 个 异步 结 


最 基本 的 一 次 性 事件 ， 就 是 一 个 后 台 运 行 出 的 计算 结果 。 和 你 已 经 了 解 
了 std::thread 执行 的 任务 不 能 有 返回 值 ， 并 且 我 能 保证 ， 这 个 问题 将 在 使 用 "期望" 后 解决 
一 一 现在 就 来 看 看 是 怎么 解决 的 。 


4.2.1 带 返 回 值 的 后 台 任 务 


假设 ， 你 有 一 个 需要 长 时 间 的 运算 ， 你 需要 其 能 计算 出 一 个 有 效 的 值 ， 但 是 你 现在 并 不 迫切 
需要 这 个 值 。 可 能 你 已 经 找到 了 a `FH’ URAWMSR > REAR E N- 
样 。 你 可 以 启动 一 个 新 线程 来 执行 这 个 计算 ， 但 是 这 就 意味 着 你 必须 关注 如 何 传 回 计算 的 结 
果 ， 因 为 std::thread 并 不 提供 直接 接收 返回 值 的 机 制 。 这 里 就 需要 std::async 函数 模板 (也 
是 在 头 文 <future> 中 声明 的 ) 了 。 


当 任 务 的 结果 你 不 着 急 要 时 ， 你 可 以 使 用 std: :async 启动 一 个 异步 任务 。 与 std: :thread 对 
象 等 待 的 方式 不 同 ， std::async 会 返回 一 个 std::future 对 象 ， 这 个 对 象 持 有 最 终 计 算出 来 
的 结果 。 当 你 需要 这 个 值 时 ， 你 只 需要 调用 这 个 对 象 的 get() 成 员 函 数 ; 并 且 会 阻塞 线程 直 
到 “期 望 "状态 为 就 绪 为 止 ; 之 后 ， 返 回 计算 结果 。 下 面 清单 中 代码 就 是 一 个 简单 的 例子 。 


清单 4.6 使 用 std::future 从 异步 任务 中 获取 返回 值 


#include <future> 
#include <iostream> 


int find_the_answer_to_ltuae(); 

void do_other_stuff(); 

int main() 

{ 
std: :future<int> 

the_answer=std: :async(find_the_answer_to_ltuae); 
do_other_stuff(); 
std::cout<<"The answer is "<<the_answer.get()<<std::endl; 


与 std::thread 做 的 方式 一 样 ” std::async 允许 你 通过 添加 额 外 的 调用 参数 ， 向 函数 传递 额 
外 的 参数 。 当 第 一 个 参数 是 一 个 指向 成 员 函 数 的 指针 ， 第 二 个 参数 提供 有 这 个 函数 成 员 类 的 
具体 对 象 (不 是 直接 的 ， 就 是 通过 指针 ， 还 可 以 包装 在 std::ref 中 )， 剩 余 的 参数 可 作为 成 员 
函数 的 参数 传 入 。 否 则 ， 第 二 个 和 随后 的 参数 将 作为 函数 的 参数 ， 或 作为 指定 可 调用 对 象 的 
第 一 个 参数 。 就 如 std::thread ， 当 参数 为 右 值 (rvalues) 时 ， 拷 贝 操作 将 使 用 移动 的 方式 转移 
原始 数据 。 这 就 允许 使 用 "只 移动 "类 型 作为 函数 对 象 和 参数 。 来 看 一 下 下 面 的 程序 清单 : 


清单 4.7 使 用 std::async 向 函数 传递 参数 


#include <string> 
#include <future> 
struct X 
{ 
void foo(int,std::string const&); 
std::string bar(std::string const&); 
}; 
X X; 
auto fi=std: :async(&X::foo0,&x,42,"hello"); // 调用 p->foo(42， 
"hello") > p48 x0 48 4t 
auto f2=std::async(&X::bar,x,"goodbye"); // 调用 
tmpx.bar("goodbye") > tmpx 是 x 的 拷贝 副本 
struct Y 
{ 
double operator()(double); 
}; 
Y y; 
auto f3=std::async(Y(),3.141); // 调用 tmpy(3.141)，tmpy 通 过 Y 的 移动 
构造 函数 得 到 
auto f4=std::async(std::ref(y),2.718); // 调用 y(2.718) 
X baz(X&); 
std: :async(baz,std::ref(x)); // 调用 baz(x) 
class move_only 
{ 
public: 
move_only(); 
move_only(move_only&&) 
move_only(move_only const&) = delete; 
move_only& operator=(move_only&&) ; 
move_only& operator=(move_only const&) = delete; 


void operator()(); 
3; 
auto f5=std::async(move_only()); // 调用 tmp()，tmp 是 通过 
std: :move(move_only( ) ) 构 造 得 到 


在 默认 情况 下 ，“ 期 望 " 是 否 进行 等 待 取 决 于 std::async 是 否 启 动 一 个 线程 ， 或 是 否 有 任务 正 
在 进行 同步 。 在 大 多 数 情况 下 (估计 这 就 是 你 想 要 的 结果 )， 但 是 你 也 可 以 在 函数 调用 之 前 ， 
向 std: :async 传递 一 个 额 外 参数 。 这 个 参数 的 类 型 是 std::launch ， 还 可 以 


是 std::launch::defered ， 用 来 表明 B He WA A 7K HE R F] wait() RK get() 2 žk A 时 才 执 

行 ， std::launch::async 表明 函数 必须 在 其 所 在 的 独立 线程 上 执行 ， std::launch::deferred 
| std::launch::async 表明 实现 可 以 选择 这 两 种 方式 的 一 种 。 最 后 一 个 选项 是 默认 的 。 当 函数 
调用 被 延迟 ， 它 可 能 不 会 在 运行 了 。 如 下 所 示 : 


auto f6=std::async(std::launch::async,Y(),1.2); // 在 新 线程 上 执行 
auto f7=std::async(std::launch::deferred,baz,std::ref(x)); // 在 
wait() 或 get() 调 用 时 执行 
auto f8=std: :async( 
std::launch::deferred | std::launch::async, 
baz,std::ref(x)); // 实现 选择 执行 方式 
auto f9=std::async(baz,std::ref(x)); 
f7.wait(); // 调用 延迟 函数 


在 本 章 的 后 面 和 第 8 章 中 ， 你 将 会 再 次 看 到 这 段 程序 ， 使 用 std::async 会 让 分 割 算法 到 各 个 
任务 中 变 的 容易 ， 这 样 程序 就 人 aie 。 不过， 这 不 是 让 一 个 std:: future ee 
实例 相关 联 的 唯一 方式 ; 你 也 可 以 将 任务 包装 入 一 个 std: :packaged_task<> 实例 中 ， 或 通过 编 
写 代 码 的 方式 ， 使 用 std: :promise<> R 类 型 模板 显示 设置 值 。 与 std: :promise<> 对 

比 ，std::packaged_task<> 具有 更 高 层 的 抽象 ， 所 以 我 们 从 “高 抽象 "的 模板 说 起 。 


4.2.2 任务 与 期 户 


std::packaged_task<> 对 一 个 函数 或 可 调用 对 象 ， 绑 定 一 个 期 望 。 当 sta: :packaged_task<> 

对 象 被 调用 ， 它 就 会 调用 相关 函数 或 可 调用 对 象 ， 将 期 望 状态 置 为 就 绪 ， 返 回 值 也 会 被 存储 

为 相关 数据 。 这 可 以 用 在 构建 线程 池 的 结构 单元 (可 见 第 9 章 )， 或 用 于 其 他 任务 的 管理 ， 比 如 

在 任务 所 在 线程 上 运行 任务 ， 或 将 它们 顺序 的 运行 在 一 个 特殊 的 后 台 线 程 上 。 当 一 个 粒度 较 

大 的 操作 可 以 被 分 解 为 独立 的 子 任务 时 ， 其 中 每 个 子 任务 就 可 以 包含 在 一 

个 std::packaged_task<> 实例 中 ， 之 后 这 个 实例 将 传递 到 任务 调度 器 或 线程 池 中 。 对 任务 的 细 
进行 抽象 ， 调 度 器 仅 处 理 std::packaged_task<> 实例 ， 而 非 处 理 单独 的 函数 。 


std::packaged_task<> 的 模板 参数 是 一 个 函数 签名 ， 比 如 void() 就 是 一 个 没有 参数 也 没有 返回 
值 的 函数 ， 或 int(std::string&, double*) 就 是 有 一 个 非 const 引 用 的 std::string 和 一 个 指向 
double 类 型 的 指针 ， Sail 。 当 你 构造 出 一 个 std::packaged_task<> 实例 时 ， 你 必 
须 传 入 一 个 函数 或 可 调用 对 象 ， 这 个 函数 或 可 调用 的 对 象 需 要 能 接收 指定 的 参数 和 返回 可 转 
rE ees ree 全 匹配 ; sae en is 回 一 个 float 
类 型 的 函数 ， 来 构建 std: :packaged_task<double(double)> 的 实例 ， 因 为 在 这 ， 类 型 可 以 隐 
式 转换 。 


-o 的 返回 类 型 可 以 用 来 标识 ， 从 get future() 返 回 的 std::future<> MRA > KH HG 
签名 的 参数 列表 ， 可 用 来 指定 “打包 任务 ”的 函数 调用 操作 符 。 例 如 ， 模 板 偏 特 
化 std: :packaged_task<std: :string(std: : vector<char>*, int )> 将 在 下 面 的 代码 清单 中 使 用 2 


清单 4.8 std::packaged_task<> 的 偏 特 化 


template<> 
class packaged task<std::string(std::vector<char>*, int)> 
{ 
public: 
template<typename Callable> 
explicit packaged_task(Callable&& f); 
std::future<std::string> get_future(); 
void operator()(std::vector<char>*, int); 


a 


这 里 的 std: :packaged_task 对 象 是 一 个 可 调用 对 象 ， 并 且 它 可 以 包含 在 一 个 std: :function 对 
象 中 ， 传 递 到 std::thread 对 象 中 ， 就 可 作为 线程 函数 ; 传递 另 一 个 函数 中 ， 就 作为 可 调用 对 
象 或 可 以 直接 进行 调用 。 当 std: :packaged_task 作为 一 信函 数 调 用 时 ， 可 为 函数 调用 操作 
符 提供 所 需 的 参数 ， 并 且 返 回 值 作 为 异步 结果 存储 在 std: :future ， 可 通过 get future() 获 

取 。 你 可 以 把 一 个 任务 包含 入 std: :packaged_task ， 并 且 在 检索 期 望 之 前 ， 需 要 

将 std::packaged_task 对 象 传 入 ， 以 便 调 用 时 能 及 时 的 找到 。 


当 你 需要 异步 任务 的 返回 值 时 ， 你 可 以 等 待 期 望 的 状态 变 为 “就绪 "。 下 面 的 代码 就 是 这 么 个 情 
JL o 


线程 间 传 递 任 务 


很 多 图 形 架 构 需 要 特定 的 线程 去 更 新 界面 ， 所 以 当 一 个 线程 需要 界面 的 更 新 时 ， 它 需要 发 出 
一 条 信息 给 正确 的 线程 ， 让 特定 的 线程 来 做 界面 更 新 。 std::packaged_task 提供 了 完成 这 种 
功能 的 一 种 方法 ， 且 不 需要 发 送 一 条 自 定义 信息 给 图 形 界面 相关 线程 。 下 面 来 看 看 代码 。 


清单 4.9 使 用 std::packaged_task 执行 一 个 图 形 界 面 线程 


#include <deque> 
#include <mutex> 
#include <future> 
#include <thread> 
#include <utility> 


std::mutex m; 
std: :deque<std: :packaged_task<void()> > tasks; 


bool gui_shutdown_message_received(); 
void get_and_process_gui_message(); 


void gui_thread() // 1 


{ 
while(!gui_shutdown_message_received()) // 2 
x 
get_and_process_gui_message(); // 3 
std: :packaged_task<void()> task; 
{ 
std::lock_guard<std::mutex> lk(m); 
if(tasks.empty()) // 4 
continue; 
task=std::move(tasks.front()); // 5 
tasks.pop_front(); 
} 
task(); // 6 
} 
} 


std::thread gui bg thread(gui thread); 


template<typename Func> 
std::future<void> post_task_for_gui_thread(Func f) 





{ 
std: :packaged_task<void()> task(f); // 7 
std::future<void> res=task.get_future(); // 8 
std::lock_guard<std::mutex> lk(m); // 9 
tasks.push_back(std::move(task)); // 10 
return res; 

} 

这 段 代 码 十 分 简单 : 图 形 界面 线程 @ 循 环 直 到 收 到 一 条 关闭 图 形 界 面 的 信息 后 关闭 @， 进 行 轮 


询 界 面 消 息 处 理 国 ， 例 如 用 户 点 击 ， 和 执行 在 队列 中 的 任务 ee 
循环 ; 除非 ， 他 能 在 队列 中 提取 出 一 个 任务 回 ， 然 后 释放 队列 上 的 锁 ， 并 且 执 行 任务 @@。 这 
里 ，* 期 望 " 与 任务 相关 ， 当 任务 执行 完成 时 ， 其 状态 会 被 置 为 “就绪 "状态 。 


将 一 个 任务 传 入 队列 ， 也 很 简单 : 提供 的 函数 加 可 以 提供 一 个 打包 好 的 任务 ， 可 以 通过 这 个 任 
务 @ 调 用 get_future() 成 员 亟 数 获取 "期望 ”对象 ， 并 且 在 任务 被 推 入 列表 @ 之 前 ，“ 期 望 "将 返回 
调用 函数 四 。 妆 需要 知道 线程 执行 完 任 务 时 ， 向 图 形 界 面 线程 发 布 消息 的 代码 ， 会 等 待 期 

望 ? 改 变 状 态 ; 否则 ， 则 会 丢弃 这 个 "期望 ”。 


这 个 例子 使 用 std: :packaged_task<void()> 创建 任务 其 包含 了 一 个 无 参数 无 返回 值 的 函数 或 
可 调用 对 象 ( 如 果 当 这 个 调用 有 返回 值 时 ， 返 回 值 会 被 丢弃 )。 这 可 能 是 最 简单 的 任务 ， 如 你 之 
前 所 见 ， std::packaged_task 也 可 以 用 于 一 些 复杂 的 情况 通过 指定 一 个 不 同 的 函数 签名 
作为 模板 参数 ， 你 不 仅 可 以 改变 其 返回 类 型 (因此 该 类 型 的 数据 会 存在 期 望 相关 的 状态 中 ) 而 
且 也 可 以 改变 函数 操作 符 的 参数 类 型 。 这 个 例子 可 以 简单 的 扩展 成 允许 任务 运行 在 图 形 界面 
线程 上 ， 且 接受 传 参 ， 还 有 通过 std: ;future 返回 值 ， 而 不 仅仅 是 完成 一 个 指标 。 





这 些 任务 能 作为 一 个 简单 的 函数 调用 来 表达 吗 ? 还 有 ， 这 些 任务 的 结果 能 从 很 多 地 方 得 到 
吗 ? 这 些 情况 可 以 使 用 第 三 种 方法 创建 “期 望 " 来 解决 : 使 用 std::promise 对 值 进行 显示 设 


4.2.3 使 用 std::promises 


当 你 有 一 个 应 用 ， 需 要 处 理 很 多 网 络 连接 ， 它 会 使 用 不 同 线程 尝试 连接 每 个 接口 ， 因 为 这 能 
使 网 络 尽早 联通 ， 尽 早 执行 程序 。 当 连接 较 少 的 时 候 ， 这 样 的 工作 没有 问题 (也 就 是 线程 数量 
比较 少 )。 不 幸 的 是 ， 随 着 连接 数量 的 增长 ， 这 种 方式 变 的 越 来 越 不 合适 ; 因为 大 量 的 线程 会 
消耗 大 量 的 系统 资源 ， 还 有 可 能 造成 上 下 文 频繁 切换 ( 当 线程 数量 超出 硬件 可 接受 的 并 发 数 

时 )， 这 都 会 对 性 能 有 影响 。 最 极端 的 例子 就 是 ， 因 为 系统 资源 被 创建 的 线程 消耗 至 尽 ， 系 统 
连接 网 络 的 能 力 会 变 的 极 差 。 在 不 同 的 应 用 程序 中 ， 存 在 着 大 量 的 网 络 连接 ， 因 此 不 同 应 用 
都 会 拥有 一 定数 量 的 线程 (可 能 只 有 一 个 ) 来 处 理 网 络 连接 ， 每 个 线程 处 理 可 同时 处 理 多 个 连接 
事件 。 

考虑 一 个 线程 处 理 多 个 连接 事件 ， 来 自 不 同 的 端口 连接 的 数据 包 基 本 上 是 以 乱 序 方式 进 
理 的 ; 同样 的 ， 数 据 包 也 将 以 乱 序 的 方式 进入 队列 。 在 很 多 情况 下 ， 另 一 些 应 用 不 是 等 
据 成 功 的 发 送 ， 就 是 等 待 一 批 (新 的 ) 来 自 指定 网 络 接口 的 数据 接收 成 功 。 


行 处 
待 数 


std: :promise<T> 提供 设 定 值 的 方式 (类 型 为 T)， 这 个 类 型 会 和 后 面 看 到 的 std: :future<T> 对 
象 相关 联 。 一 对 std: :promise/std::future 会 为 这 种 方式 提供 一 个 可 行 的 机 制 ; 在 期 望 上 可 以 
阻塞 等 待 线 程 ， 同 时 ， 提 供 数 据 的 线程 可 以 使 用 组 合 中 的 “承诺 "来 对 相关 值 进行 设置 ， 以 及 
将 “期 望 * 的 状态 置 为 "就 绪 "。 


可 以 通过 get future() 成 员 兄 数 来 获取 与 一 个 给 定 的 std::promise 相关 的 std::future WR? 
就 像 是 与 std::packaged_task 相关 。 当 “承诺 ”的 值 已 经 设置 完毕 (使 用 set_value() 成 员 郊 数 ) ， 
对 应 “期 望 "的 状态 变 为 “就 绪 "， 并且 可 用 于 检索 已 存储 的 值 。 当 你 在 设置 值 之 前 销 

Bt std: promise ， 将 会 存储 一 个 异常 A 在 4.2.4 节 中 2 会 详细 描述 异常 是 如 何 传送 到 线程 的 。 


清单 4.10 中 ， 是 单线 程 处 理 多 接口 的 实现 ， 如 同 我 们 所 说 的 那样 。 在 这 个 例子 中 ， 你 可 以 使 
用 一 对 std::promise<bool>/std::future<bool> 找 出 一 块 传 出 成 功 的 数据 块 ; 与 期望? 相关 值 只 
是 一 个 简单 的 “成 功 /失败 "标识 。 对 于 传 入 包 ， 与 期望" 相关 的 数据 就 是 数据 包 的 有 效 负 载 。 


清单 4.10 使 用 “承诺 "解决 单线 程 多 连接 问题 


#include <future> 


void process_connections(connection_set& connections) 


{ 


while(!done(connections)) // 1 


È 


for(connection_iterator // 2 


connection=connections.begin(),end=connections.end(); 
connection!=end; 


++connection) 
{ 
if(connection->has_incoming_data()) // 3 
{ 
data_packet data=connection->incoming(); 
std: :promise<payload_type>& p= 
connection->get_promise(data.id); // 4 
p.set_value(data.payload) ; 
} 
if(connection->has_outgoing_data()) // 5 
{ 
outgoing packet data= 
connection->top_of_outgoing_queue(); 
connection->send(data. payload); 
data.promise.set_value(true); // 6 
} 
} 


函数 process_connections() 中 ， 直 到 done() 返 回 true@@ 为 止 。 每 一 次 循环 ， 程 序 都 会 依次 的 检 
查 每 一 个 连接 @@， 检 索 是 否 有 数据 加 或 正在 发 送 已 入 队 的 传 出 数据 @@。 这 里 假设 输入 数据 包 是 
具有 ID 和 有 效 负 载 的 (有 实际 的 数 在 其 中 ) 。 一 个 ID 映射 到 一 个 sta: :promise (可 能 是 在 相 关 容 
器 中 进行 的 依次 查找 )@， 并 且 值 是 设置 在 包 的 有 效 负载 中 的 。 对 于 传 出 包 ， 包 是 从 传 出 队列 
中 进行 检索 的 ， 实 际 上 从 接口 直接 发 送出 去 。 当 发 送 完 成 ， 与 传 出 数据 相关 的 “承诺 "将 置 为 
true， 来 表明 传输 成 功 @@。 这 是 否 能 映射 到 实际 网 络 协议 上 ， 取 决 于 网 络 所 用 协议 ; 这 里 

的 “承诺 /期 望 " 组 合 方式 可 能 会 在 特殊 的 情况 下 无 法 工作 ， 但 是 它 与 一 些 操 作 系 统 支持 的 异步 
输入 /输出 结构 类 似 。 


上 面 的 代码 完全 不 理会 异常 ， 它 可 能 在 想象 的 世界 中 ， 一 切 工作 都 会 很 好 的 执行 ， 但 是 这 有 
履 常 理 。 有 时 候 磁盘 满载 ， 有 时 候 你 会 找 不 到 东西 ， 有 时 候 网 络 会 断 ， 还 有 时 候 数据 库 会 大 
溃 。 当 你 需要 某 个 操作 的 结果 时 ， 你 就 需要 在 对 应 的 线程 上 执行 这 个 操作 ， 因 为 代码 可 以 通 
过 一 个 异常 来 报告 错误 ; 不 过 使 用 std: :packaged_task 或 std::promise ’ 就 会 带 来 一 些 不 必 
要 的 限制 (在 所 有 工作 都 正常 的 情况 下 )。 因 此 ，C++ 标 准 库 提 供 了 一 种 在 以 上 情况 下 清理 异常 
的 方法 ， 并 且 允 许 他 们 将 异常 存储 为 相关 结果 的 一 部 分 。 


4.2.4 为 cc Hy 望 ” 存 储 “ 异 常 ” 


看 完 下 面 短小 的 代码 段 ， 思 考 一 下 ， 当 你 传递 -1 到 square_root() 中 时 ， 它 将 抛 出 一 个 异常 ， 并 
且 这 个 异常 将 会 被 调用 者 看 到 : 


double square_root(double x) 


{ 
if (x<0) 
{ 
throw std::out_of_range(“x<0”); 
} 
return sqrt(x); 
} 


假设 调用 square_root() 函 数 不 是 当前 线程 ， 


double y=square_root(-1); 


你 将 这 样 的 调用 改 为 异步 调用 : 


std::future<double> f=std: :async(square_root, -1); 
double y=f.get(); 


如 果 行 为 是 完全 相同 的 时 候 ， 其 结果 是 理想 的 ; 在 任何 情况 下 ，y 获 得 函数 调用 的 结果 ， 当 线 
程 调用 fget() 时 ， 就 能 再 看 到 异常 了 ， 即 使 在 一 个 单线 程 例 子 中 。 


好 吧 ， 事 实 的 确 如 此 : 函数 作为 std::async 的 一 部 分 时 ， 当 在 调用 时 抛 出 一 个 异常 ， 那 么 这 
个 异常 就 会 存储 到 “期 望 "的 结果 数据 中 ， 之 后 "期 望 "的 状态 被 置 为 就绪"， 之 后 调用 get() 会 抛 
出 这 个 存储 的 异常 。( 注 意 : 标准 级 别 没有 指定 重新 抛 出 的 这 个 异常 是 原始 的 异常 对 象 ， 还 是 
一 个 拷贝 ; 不 同 的 编译 器 和 库 将 会 在 这 方面 做 出 不 同 的 选择 )。 当 你 将 函数 打包 

入 std::packaged_task 任务 包 中 后 ， 在 这 个 任务 被 调用 时 ， 同样 的 事情 也 会 发 生 ; 347 
数 抛 出 一 个 异常 ， 这 个 异常 将 被 存储 在 “期 望 "的 结果 中 ， 准 备 在 调用 get() 再 次 抛 出 。 


当然 ， 通过 函数 的 显 式 调用 ” std::promise 也 能 提供 同样 的 功能 当 你 硕 望 存 入 的 是 一 个 异 
常 而 非 一 个 数值 时 ， 你 就 需要 调用 set exception() 成 员 函 数 ， 而 非 set value()。 这 通常 是 用 在 
一 个 catch 块 中 ， 并 作为 算法 的 一 部 分 ， 为 了 捕获 异常 ， 使 用 异常 填充 “承诺 ”: 


extern std::promise<double> some_promise; 


try 
{ 
some_promise.set_value(calculate_value()); 
} 
catch(...) 
{ 
some_promise.set_exception(std::current_exception()); 
} 


这 里 使 用 了 std: :current_exception( ) 来 检索 抛 出 的 异常 ; 可 用 std: :copy_exception() 作为 
一 个 替换 方案 ” std::copy_exception() 会 直接 存储 一 个 新 的 异常 而 不 抛 出 : 


some_promise.set_exception(std::copy_exception(std::logic_error( 
too 


这 就 比 使 用 try/catch 块 更 加 清晰 ， 当 弄 常 类 型 是 已 知 的 ， 它 就 应 该 优先 被 使 用 ; 不 是 因为 代码 
实现 简单 ， 而 是 它 给 编译 器 提供 了 极 大 的 代码 优化 空间 。 


另 一 种 向 "期望 "中 存储 异常 的 方式 是 ， 在 没有 调用 “承诺 "上 的 任何 设置 济 数 前 ， 或 正在 调用 包 
装 好 的 任务 时 ， 销 毁 与 std::promise 或 std::packaged_task 相关 的 "期望 对象。 在 这 任何 情况 
下 ， 当 "期 望 "的 状态 还 不 是 就绪" 时 ， 调 用 sta: :promise 或 std: :packaged_task 的 析 构 函数 ， 
将 会 存储 一 个 与 std::future_errc::broken_promise 错误 状态 相关 的 std: :future_error 异常 ; 
通过 创建 一 个 “期望 *， 你 可 以 构造 一 个 “承诺 ?为 其 提供 值 或 异常 RTM HR 
源 ， 去 违背 “承诺 "”。 在 这 种 情况 下 ， 编 译 器 没有 在 期望" 中 存储 任何 东西 ， 等 待 线程 可 能 会 永 
远 的 等 下 去 。 

直到 现在 2 所 有 例子 都 在 用 std::future 。 不 过 ， std::future 也 有 局 限 性 ? 在 很 多 线程 在 等 


待 的 时 候 ， 只 有 一 个 线程 能 获取 等 待 结果 。 当 多 个 线程 需要 等 待 相同 的 事件 的 结果 ， 你 就 需 
要 使 用 std::shared_ future 来 替代 std::future 了 。 


4.2.5 多 个 线程 的 等 竺 


虽然 std: :future 可 以 处 理 所 有 在 线程 间 数 据 转移 的 必要 同步 ， 但 是 调用 某 一 特 
殊 std::future 对 象 的 成 员 有 函数 ， 就 会 让 这 个 线程 的 数据 和 其 他 线程 的 数据 不 同步 。 当 多 线程 
在 没有 额外 同步 的 情况 下 ， 访 问 一 个 独立 的 std::future 对 象 时 ， 就 会 有 数据 竞争 和 未 定义 的 


行为 。 这 是 因为 : std::future 模型 独 享 同步 结果 的 所 有 权 ， 并 且 通 过 调用 get() 有 函数， 一 次 性 
的 获取 数据 ， 这 就 让 并 发 访问 变 的 毫 无 意义 一 “只 有 一 个 线程 可 以 获取 结果 值 ， 因 为 在 第 一 
次 调用 get() 后 ， 就 没有 值 可 以 再 获取 了 。 





如 果 你 的 并 行 代码 没有 办 法 让 多 个 线程 等 待 同一 个 事件 ， 先 别 太 失 

% ; std::shared_future 可 以 来 帮 你 解决 。 因 为 std::future 是 只 移动 的 ， 所 以 其 所 有 权 可 以 
在 不 同 的 实例 中 互相 传递 ， 但 是 只 有 一 个 实例 可 以 获得 特定 的 同步 结果 ; 

而 std::shared_future 实例 是 可 拷贝 的 ， 所 以 多 个 对 象 可 以 引用 同一 关联 “期 望 "的 结果 。 


在 每 一 个 std: :shared future 的 独立 对 象 上 成 员 函 数 调 用 返回 的 结果 还 是 不 同步 的 ， 所 以 为 
了 在 多 个 线程 访问 一 个 独立 对 象 时 ， 避 免 数据 竞争 ， 必 须 使 用 锁 来 对 访问 进行 保护 。 优 先 使 
用 的 办 法 : 为 了 替代 只 有 一 个 拷贝 对 象 的 情况 ， 可 以 让 每 个 线程 都 拥有 自己 对 应 的 拷贝 对 
象 。 这 样 ， 当 每 个 线程 都 通过 自 己 拥 有 的 std::shared_future 对 象 获取 结果 ， 那么 多 个 线程 
访问 共享 同步 结果 就 是 安全 的 。 可 见 图 4.1。 
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图 4.1 使 用 多 个 std::shared future 对 象 来 避免 数据 竞争 


有 可 能 会 使 用 std::shared_future 的 地 方 ， 例 如 ， 实 现 类 似 于 复杂 的 电子 表格 的 并 行 执 行 ; 

每 一 个 单元 格 有 单一 的 终 值 ， 这 个 终 值 可 能 是 有 其 他 单元 格 中 的 数据 通过 公式 计算 得 到 的 。 

公式 计算 得 到 的 结果 依赖 于 其 他 单元 格 ， 然 后 可 以 使 用 一 个 std::shared_future 对 象 引用 第 
一 个 单元 格 的 数据 。 当 每 个 单元 格 内 的 所 有 公式 并 行 执行 后 ， 这 些 任务 会 以 期 望 的 方式 完成 
工作 ; 不 过 ， 当 其 中 有 计算 需要 依赖 其 他 单元 格 的 值 ， 那 么 它 就 会 被 阻塞 ， 直 到 依赖 单元 格 
的 数据 准备 就 绪 。 这 将 让 系统 在 最 大 程度 上 使 用 可 用 的 硬件 并 发 。 


std::shared_future 的 实例 同步 std::future 实例 的 状态 。 当 std::future 对 象 没 有 与 其 他 对 
象 共享 同 步 状态 所 有 权 > AB 么 所 有 权 必 须 使 用 std: :move 将 所 有 权 传 递 
到 std::shared future ， 其 默认 构造 函数 如 下 : 


std: :promise<int> p; 

std::future<int> f(p.get_future()); 
assert(f.valid()); // 1 "期 望 " f 是 合法 的 
std::shared_future<int> sf(std::move(f)); 
assert(!f.valid()); // 2 "期 望 " f 现在 是 不 合法 的 
assert(sf.valid()); // 3 sf 现在 是 合法 的 


这 里 ，“ 期 望 f 开 始 是 合法 的 加， 因为 它 引 用 的 是 “承诺 "p 的 同步 状态 ， 但 是 在 转移 sf 的 状态 后 ， 
f 就 不 合法 了 @@， 而 sf 就 是 合法 的 了 @@。 


如 其 他 可 移动 对 象 一 样 ， 转 移 所 有 权 是 对 右 值 的 隐 式 操作 ， 所 以 你 可 以 通过 std::promise 对 
象 的 成 员 & a get_future() 49 2% 144 ， 直 接 构造 一 个 std::shared_ future 对 象 ， 例 如 : 


std::promise<std::string> p; 
std: :shared_future<std::string> sf(p.get_future()); // 1 隐 式 转移 
所 有 权 


这 里 转移 所 有 权 是 隐 式 的 ; 用 一 个 右 值 构造 std: :shared future<> ， 得 


到 std::future<std::string> 类 型 的 实例 @。 


std::future 的 这 种 特性 ， 可 促进 std::shared_future 的 使 用 ， 容 器 可 以 自动 的 对 类 型 进行 推 
断 ， 从 而 初始 化 这 个 类 型 的 变量 ( 详 见 附录 A，A.6 节 )。 std::future 有 一 个 share() 成 员 有 函数 ， 
可 用 来 创建 新 的 std: :shared_future ， 并 且 可 以 直接 转移 “期 望 "的 所 有 权 。 这 样 也 就 能 保存 很 
多 类 型 ， 并 且 使 得 代码 易于 修改 : 


std::promise< std::map< SomeIndexType, SomeDataType, 
SomeComparator, 

SomeAllocator>::iterator> p; 
auto sf=p.get_future().share(); 


在 这 个 例子 中 ，Sf 的 类 型 推 到 为 std::shared_future<std: :map<SomeIndexType, SomeDataType, 
SomeComparator, SomeAllocator>::iterator> ， 一 口 Auk BADR HER 。 当 比较 器 或 分 配器 有 所 
改动 ， 你 只 需要 对 “承诺 "的 类 型 进行 修改 即 可 ; “期 望 "的 类 型 会 自动 更 新 ， 与 "承诺 ?的 修改 进 
行 匹 配 。 


有 时 候 你 需要 限定 等 待 一 个 事件 的 时 间 ， 不 论 是 因为 你 在 时 间 上 有 硬性 规定 (一 段 指定 的 代码 
需要 在 某 段 时 间 内 完成 )， 还 是 因为 在 事件 没有 很 快 的 触发 时 ， 有 其 他 必要 的 工作 需要 特定 线 
程 来 完成 。 为 了 处 理 这 种 情况 ， 很 多 等 待 函数 具有 用 于 指定 超时 的 变量 。 


[1] 在 《银河 系 漫游 指南 》(The Hitchhiker’s Guide to the Galaxy) 中 , 计算 机 在 经 过 深度 思考 
后 ， 将 “人 生 之 是 和 宇宙 万 物 ” 的 答案 确定 为 42。 


4.3 限定 等 待 时 间 


之 前 介绍 过 的 所 有 阻塞 调用 ， 将 会 阻塞 一 段 不 确定 的 时 间 ， 将 线程 挂 起 直到 等 待 的 事件 发 
生 。 在 很 多 情况 下 ， 这 样 的 方式 很 不 错 ， 但 是 在 其 他 一 些 情况 下 ， 你 就 需要 限制 一 下 线程 等 
待 的 时 间 了 。 这 多 许 你 发 送 一 些 类 似 “ 我 还 存活 "的 信息 ， 无 论 是 对 交互 式 用 户 ， 或 是 其 他 进 
程 ， 亦 或 当 用 户 放弃 等 待 ， 你 可 以 按 下 "取消 " 键 直接 终止 等 待 。 


介绍 两 种 可 能 是 你 希望 指定 的 超时 方式 : 一 种 是 “时 延 " 的 超时 方式 ， 另 一 种 是 “绝对 "超时 方 

式 。 第 一 种 方式 ， 需 要 指定 一 段 时 间 ( 例 如 ，30 毫 秒 ) ; 第 二 种 方式 ， 就 是 指定 一 个 时 间 点 ( 例 
如 ， 协 调 世界 时 [UTC]17:30:15.045987023，2011 年 11 月 30 日 )。 多 数 等 待 函 数 提供 变量 ， 对 
两 种 超时 方式 进行 处 理 。 处 理 持 续 时 间 的 变量 以 * foP 作 为 后 组， 处 理 绝对 时 间 的 变量 

VA" until" 作 为 后 级 。 


所 以 ， 当 std::condition_variable 的 两 个 成 员 有 子 数 wait_ for(0 和 wait _until() 成 员 有 函数 分 别 有 两 
个 负载 ， 这 两 个 负载 都 与 wait() 成 员 有 函数 的 负载 相关 一 其 中 一 个 负载 只 是 等 待 信 号 触发 ， 或 
时 间 超 期 ， 亦 或 是 一 个 虚假 的 唤醒 ， 并 且 醒 来 时 ， 会 检查 锁 提 供 的 谓词 ， 并 且 只 有 在 检查 为 
true 时 才 会 返回 (这 时 条 件 变 量 的 条 件 达 成 )， 或 直接 而 超时 。 

在 我 们 观察 使 用 超时 函数 的 细节 前 ， 让 我 们 来 检查 一 下 时 间 在 C++ 中 指定 的 方式 ， 就 从 时 钟 开 
始 吧 | 


4.3.1 时 钟 


对 于 C++ 标准 库 来 说 ， 时 钟 就 是 时 间 信 息 源 。 特 别 是 ， 时 钟 是 一 个 类 ， 提 供 了 四 种 不 同 的 信 
自 、 。 


e 现在 时 间 
e 时 间 类 型 
e 时 钟 节拍 
o 通过 时 钟 节拍 的 分 布 ， 判 断 时 钟 是 否 稳定 


时 钟 的 当前 时 间 可 以 通过 调用 静态 成 员 函 数 now() 从 时 钟 类 中 获取 ; 例 

如 ， std::chrono::system_clock: :now() 是 将 返回 系统 时 钟 的 当前 时 间 。 特 定 的 时 间 点 类 型 可 
以 通过 time_point 的 数据 typedef 成 员 来 指定 ， 所 以 some_clock::now() 的 类 型 就 是 
some_clock::time_point ° 


时 钟 节拍 被 指定 为 1/x(X 在 不 同 硬件 上 有 不 同 的 信 ) 秒 ， 这 是 由 时 间 周 期 所 决定 一 一 个 时 钟 一 
秒 有 25 个 节拍 ， 因 此 一 个 周期 为 std::ratio<1, 25> ， 当 一 个 时 钟 的 时 钟 节拍 每 2.5 秒 一 次 ， 
周期 就 可 以 表示 为 std::ratio<5，2> 。 当 时 钟 节拍 直到 运行 时 都 无 法 知晓 ， 可 以 使 用 一 个 给 


定 的 应 用 程序 运行 多 次 ， 周 期 可 以 用 执行 的 平均 时 间 求 出 ， 其 中 最 短 的 时 间 可 能 就 是 时 钟 节 
拍 ， 或 者 是 直接 写 在 手册 当中 。 这 就 不 保证 在 给 定 应 用 中 观察 到 的 节拍 周期 与 指定 的 时 钟 周 
期 相 匹配 。 


当时 钟 节拍 均匀 分 布 (无 论 是 否 与 周期 匹配 )， 并 且 不 可 调整 ， 这 种 时 钟 就 称 为 稳定 时 钟 。 当 
is_steady 静 态 数据 成 员 为 tue 时 ， 表 明 这 个 时 钟 就 是 稳定 的 ， 否 则 ， 就 是 不 稳定 的 。 通 常情 
况 下 ， std::chrono::system_clock 是 不 稳定 的 ， 因 为 时 钟 是 可 调 的 ， 即 是 这 种 是 完全 自动 适 
应 本 地 账户 的 调节 。 这 种 调节 可 能 造成 的 是 ， 首 次 调用 now() 返 回 的 时 间 要 早 于 上 次 调用 
how() 所 返回 的 时 间 ， 这 就 违反 了 节拍 频率 的 均 习 分 布 。 稳 定 阅 钟 对 于 起 时 的 计算 很 重要 ， 所 
以 C++ 标准 库 提 供 一 个 稳定 时 钟 std: :chrono::steady clock 。C++ 标 准 库 提 供 的 其 他 时 钟 可 表 
示 为 std::chrono::system_clock (在 上 面 已 经 提 到 过 )， 它 代表 了 系统 时 钟 的 “实际 时 间 ”， 并且 
提供 了 函数 可 将 时 间 点 转化 为 time t 类 型 的 值 ; std::chrono::high_resolution_clock 可 能 是 
标准 库 中 提供 的 具有 最 小 节拍 周期 (因此 具有 最 高 的 精度 [分 状 率 ]) 的 时 钟 。 它 实际 上 是 typedef 
的 另 一 种 时 钟 ， 这 些 时 钟 和 其 他 与 时 间 相 关 的 工具 ， 都 被 定义 在 库 头 文件 中 。 


我 们 马上 来 看 一 下 时 间 点 是 如 何 表示 的 ， 但 在 这 之 前 ， 我 们 先 看 一 下 持续 时 间 是 怎么 表示 
的 。 


4.3.2 时 延 


时 延 是 时 间 部 分 最 简单 的 ; std::chrono: :duration<> 郊 数 模板 能 够 对 时 延 进行 处 理 ( 线 程 库 使 
用 到 的 所 有 C++ 时 间 处 理工 具 ， 都 在 std::chrono 命名 空间 内 ) 。 第 一 个 模板 参数 是 一 个 类 型 
表示 (比如 ，int，long 或 double)， 第 二 个 模板 参数 是 制定 部 分 ， 表 示 每 一 个 单元 所 用 秒 数 。 例 
如 ， 当 几 分 钟 的 时 间 要 存在 short 类 型 中 时 ， 可 以 写成 std::chrono::duration<short, 
std::ratio<60, 1>> ? 因为 60 秒 是 才 是 1 分 钟 所 以 第 二 个 参数 写成 std::ratio<60, 1> ° 另 一 
方面 ， 当 需要 将 毫秒 级 计数 存在 double 类 型 中 时 ， 可 以 写成 std::chrono: :duration<double， 
std::ratio<1, 1000>> ° 因为 1 秒 等 于 1000 毫 秒 。 


标准 库 在 std::chrono 命名 空间 内 ， 为 延 时 变量 提供 一 系列 预定 义 类 型 : nanoseconds[ 纳 秒 ] ， 
microseconds[ 微 秒 ] , milliseconds[ 毫 秒 ] , seconds[ 秒 ] , minutes[ 分 ] 和 hours[ 时 ]。 比 如 ， 你 要 
在 一 个 合适 的 单元 表示 一 段 超过 500 年 的 时 延 ， 预 定义 类 型 可 充分 利用 了 大 整 型 ， 来 表示 所 要 
表示 的 时 间 类 型 。 当 然 ， 这 里 也 定义 了 一 些 国际 单位 制 (S1, [法 ]le Systeme international 
d'unités) 分 数 ， 可 从 std::atto(19A(-18)) 到 std::exa(19A(18)) ( 题 外 话 : 当 你 的 平台 支持 128 
位 整 型 ); 也 可 以 指定 自 定义 时 延 类 型 ， 例 如 ， std::duration<double, std::centi> ， 就 可 以 使 
用 一 个 double 类 型 的 变量 表示 1/100。 


当 不 要 求 截断 值 的 情况 下 (时 转换 成 秒 是 没 问 题 ， 但 是 秒 转 换 成 时 就 不 行 ) 时 延 的 转换 是 隐 式 
的 。 显 示 转 换 可 以 由 std::chrono::duration_cast<> 来 完成 。 


std::chrono: :milliseconds ms(54802); 
std::chrono::seconds s= 
std: :chrono::duration_cast<std: :chrono::seconds>(ms) ; 


这 里 的 结果 就 是 截断 的 ， 而 不 是 进行 了 舍 入 ， 所 以 Ss 最 后 的 值 将 为 54 。 


延迟 支持 计算 ， 所 以 你 能 够 对 两 个 时 延 变量 进行 加 减 ， 或 者 是 对 一 个 时 延 变量 乘除 一 个 常数 
(模板 的 第 一 个 参数 ) 来 获得 一 个 新 延迟 变量 。 例 如 ，5*seconds(1) 与 seconds(5) 或 minutes(1)- 
seconds(55) 一 样 。 在 时 延 中 可 以 通过 count() 成 员 吨 数 获得 单位 时 间 的 数量 。 例 

如 ， std::chrono: :milliseconds (1234) .count() 就 是 1234 © 


基于 时 延 的 等 待 可 由 std::chrono: :duration<> 来 完成 。 例 如 ， 你 等 待 一 个 “期望” 状态 变 为 就 绪 
已 经 35 毫 秒 : 


std::future<int> f=std::async(some_task); 
if(f.wait_for(std::chrono: :milliseconds(35) )==std::future_status 
: ready) 

do_something_with(f.get()); 


等 待 函 数 会 返回 一 个 状态 值 ， 来 表示 等 待 是 超时 ， 还 是 继续 等 待 。 在 这 种 情况 下 ， 你 可 以 等 
待 一 个 "期望 *， 所 以 当 部 数 等 待 超时 时 ， 会 返回 std::future_status::timeout ; 当 " 期 望 " 状 态 
改变 ， 函 数 会 返回 std::future_status::ready ; 当 “ 期 望 "的 任务 延迟 了 ， 函 数 会 返 

回 std::future_status::deferred 。 基 于 时 延 的 等 待 是 使 用 内 部 库 提供 的 稳定 时 钟 ， 来 进行 1 
时 的 ; 所 以 ， 即 使 系统 时 钟 在 等 待 时 被 调整 (向 前 或 向 后 )，35 毫 秒 的 时 延 在 这 里 意味 着 ， 
耗 时 35 毫 秒 。 当 然 ， 难 以 预料 的 系统 调度 和 不 同 操作 系统 的 时 钟 精度 都 意味 着 : 在 线程 中 ， 
从 调用 到 返回 的 实际 时 间 可 能 要 比 35 毫 秒 长 。 


时 延 中 没有 特别 好 的 办 法 来 处 理 以 上 情况 ， 所 以 我 们 暂且 停 下 对 时 延 的 讨论 。 现 在 ， 我 们 就 
要 来 看 看 "时间 点 "是 怎么 样 工作 的 。 


4.3.3 时 间 点 


时 钟 的 时 间 点 可 以 用 std::chrono::time point<> 的 类 型 模板 实例 来 表示 ， 实 例 的 第 一 个 参数 
用 来 指定 所 要 使 用 的 时 钟 ， 第 二 个 函数 参数 用 来 表示 时 间 的 计量 单位 ( 特 化 
的 std::chrono::duration<> )。 一 个 时 间 点 的 值 就 是 时 间 的 长 度 ( 在 指定 时 间 的 倍数 内 )， 例 
如 ， 指 定 “unix 时 间 和 戳 "(epoch) 为 一 个 时 间 点 。 时 间 改 是 时 钟 的 一 个 基本 属性 ， 但 是 不 可 以 直接 
查询 ， 或 在 C++ 标准 中 已 经 指定 。 通 常 ，unix 时 间 稚 表示 1970 年 1 月 1 日 00:00， 即 计算 机 局 动 
应 o 时钟 可 能 共享 一 个 时 间 惟 ， 或 具有 独立 的 时 间 崔 。 当 两 个 时 钟 共 享 一 个 时 间 疏 
， 其 中 一 个 time_point 类 型 可 以 与 另 一 个 时 钟 类 型 中 的 time_point 相 关联 。 这 里 ， 虽 然 你 无 
十 什 和 ， 但 是 你 可 以 通过 对 指定 time_point 类 型 使 用 time_since_epoch() 来 
获取 时 间 惟 。 这 个 成 员 坊 数 会 返回 一 个 时 延 值 ， 这 个 时 延 值 是 指定 时 间 点 到 时 钟 的 unix 时 间 稚 
锁 用 时 。 


例如 ， 你 可 能 指定 了 一 个 时 间 点 std::chrono: :time_point<std::chrono::system_clock, 
std::chrono::minutes> 。 这 就 与 系统 时 钟 有 关 ， 且 实 际 中 的 一 分 钟 与 系统 时 钟 精度 应 该 不 相 同 
(通常 差 几 秒 ) 。 


你 可 以 通过 std::chrono: :time_point<> 实例 来 加 / 减 时 延 ， 来 获得 一 个 新 的 时 间 点 ， 所 

VA std::chrono: :hight_resolution_clock::now() + std::chrono: :nanoseconds(500) 将 得 到 500 纳 
稍 后 的 时 间 。 当 你 知道 一 块 代码 的 最 大 时 延 时 ， 这 对 于 计算 绝对 时 间 的 超时 是 一 个 好 消息 ， 
当 等 待 时 间 内 ， 等 待 函 数 进 行 多 次 调用 ; 或 ， 非 等 待 部 数 且 占用 了 等 待 函 数 时 延 中 的 时 间 。 


你 也 可 以 减 去 一 个 时 间 点 (二 者 需要 共享 同一 个 时 钟 )。 结 果 是 两 个 时 间 点 的 时 间 差 。 这 对 于 代 
码 块 的 计时 是 很 有 用 的 ， 例 如 : 


auto start=std::chrono::high_resolution_clock: :now(); 
do_something(); 
auto stop=std::chrono: :high_resolution_clock: :now(); 
std: :cout<<”’do_something() took “ 

<<std::chrono: :duration<double, std: : chrono: :seconds>(stop- 
start).count() 

<<” seconds”<<std::endl; 


std::chrono::time_point<> 实例 的 时 钟 参数 可 不 仅 是 能 够 指定 unix 时 间 改 的 。 当 你 想 一 个 等 
待 函 数 (绝对 时 间 超 时 的 方式 ) 传 递 时 间 点 时 ， 时 间 点 的 时 钟 参 数 就 被 用 来 测量 时 间 。 当 时 钟 变 
更 时 ， 会 产生 严重 的 后 果 ， 因 为 等 待 轨迹 随 着 时 钟 的 改变 而 改变 ， 并 且 知 道 调 用 时 钟 的 now() 
成 员 有 函数 时 ， 才 能 返回 一 个 超过 超时 时 间 的 值 。 当 时 钟 向 前 调整 ， 这 就 有 可 能 减 小 等 待 时 间 
的 总 长 度 (与 稳定 时 钟 的 测量 相 比 ) ; 当时 钟 向 后 调整 ， 就 有 可 能 增加 等 待 时 间 的 总 长 度 。 


如 你 期 望 的 那样 ， 后 缓 为 _unitl 的 (等 待 函 数 的 ) 变 量 会 使 用 时 间 点 。 通 常 是 使 用 某 些 时 钟 

的 ::now() (程序 中 一 个 国定 的 时 间 点 ) 作 为 偏 移 ， 虽 然 时 间 点 与 系统 时 钟 有 关 ， 可 以 使 

用 std: :chrono: :system_clock::to_time_point() 静态 成 员 BA E 在 用 户 可 视 时 间 点 上 进行 调 
度 操作 。 例 如 ， 当 你 有 一 个 对 多 等 待 500 毫 秒 的 ， 且 与 条 件 变 量 相关 的 事件 ， 你 可 以 参考 如 下 
代码 : 


清单 4.11 等 待 一 个 条 件 变 量 一 有 超时 功能 


#include <condition variable> 
#include <mutex> 
#include <chrono> 


std::condition_variable cv; 
bool done; 


std::mutex m; 


bool wait_loop() 


{ 
auto const timeout= std::chrono::steady_clock: :now( )+ 
std::chrono: :milliseconds(500); 
std: :unique_lock<std::mutex> lk(m); 
while(!done) 
{ 
if(cv.wait_until(1k, timeout )==std: :cv_status: : timeout ) 
break; 
} 
return done; 
} 


这 种 方式 是 我 们 推荐 的 ， 当 你 没有 什么 事情 可 以 等 待 时 ， 可 在 一 定时 限 中 等 待 条 件 变 量 。 在 
这 种 方式 中 ， 循 环 的 整体 长 度 是 有 限 的 。 如 你 在 4.1.1 节 中 所 见 ， 当 使 用 条 件 变 量 ( 且 无 事 可 待 ) 
时 ， 你 就 需要 使 用 循环 ， 这 是 为 了 处 理 假 唤 醒 。 当 你 在 循环 中 使 用 wait for() 时 ， 你 可 能 在 等 
待 了 足够 长 的 时 间 后 结束 等 待 (在 假 唤醒 之 前 )， 且 下 一 次 等 待 又 开始 了 。 这 可 能 重复 很 多 次 ， 
使 得 等 待 时 间 无 边 无 际 。 


到 此 ， 有 关 时 间 点 超时 的 基本 知识 你 已 经 了 解 了 。 现 在 ， 让 我 们 来 了 解 一 下 如 何在 函数 中 使 
用 超时 。 


4.3.4 具有 超时 功能 的 函数 


使 用 超时 的 最 简单 方式 就 是 ， 对 一 个 特定 线程 添加 一 个 延迟 处 理 ; 当 这 个 线程 无 所 事 事 时 ， 
就 不 会 占用 可 供 其 他 线程 处 理 的 时 间 。 你 在 4.1 节 中 看 过 一 个 例子 ， 你 循环 检查 “done” 标 志 。 
两 个 处 理 函 数 分 别 是 std::this_thread::sleep_for() 和 std: :this_thread::sleep_until() ° 他 
们 的 工作 就 像 一 个 简单 的 闹钟 : 当 线程 因为 指定 时 延 而 进入 睡眠 时 ， 可 使 用 sleep_for() 唤 醒 ; 
或 因 指定 时 间 点 睡眠 的 ， 可 使 用 sleep_until 唤 醒 。sleep_for() 的 使 用 如 同 在 4.1 节 中 的 例子 ， 
有 些 事 必须 在 指定 时 间 范 围 内 完成 ， 所 以 耗 时 在 这 里 就 很 重要 。 另 一 方面 ，sleep_until() 允 许 
在 某 个 特定 时 间 点 将 调度 线程 唤醒 。 这 有 可 能 在 晚间 备份 ， 或 在 早上 6:00 打 印 工资 条 时 使 

用 ， 亦 或 挂 起 线程 直到 下 一 帧 刷新 时 进行 视频 播放 。 


当然 ， 休 眠 只 是 超时 处 理 的 一 种 形式 ; 你 已 经 看 到 了 ， 超 时 可 以 配合 条 件 变 量 和 "期 望 " 一 起 使 
用 。 超 时 甚至 可 以 在 尝试 获取 一 个 互 斥 锁 时 ( 当 互 斥 量 支持 超时 时 ) 使 

用 。 std::mutex 和 std::recursive_mutex 都 不 支持 超时 锁 ， 但 

是 std::timed_mutex 和 std::recursive_timed_mutex 支持 。 这 两 种 类 型 也 有 try_lock for() 和 
try_lock_until() 成 员 骂 数 ， 可 以 在 一 段 时 期 内 尝试 ， 或 在 指定 时 间 点 前 获取 互 斥 锁 。 表 4.1 展 示 
了 C++ 标准 库 中 支持 超时 的 函数 。 BBD RA “EH” (duration) ss AM Æ std::duration<> 的 实 

例 ， 并 且 列 出 为 时 间 点 (time_point) 必 须 是 std::time_point<> 的 实例 。 


表 4.1 可 接受 超时 的 函数 


类 型 /命名 空间 函数 返回 值 
sleep_for(duration) 

std::this_thread[namespace] N/A 
sleep_until(time_point) 


wait_for(lock, duration) 





std::condition_variable 或 std::cv_status::time_out 
std::condition_variable_any wait_until(lock, std::cv_status::no_timec 
time_point) 
wait_for(lock, duration, 
predicate) bool —— 当 唤醒 时 ， 返 
谓词 的 结 
wait_until(lock, duration, — 词 的 结果 
predicate) 
std::timed_mutex 或 try_lock_for(duration) bool 获取 锁 时 返回 


std::recursive_timed_mutex true’ @ 4 elfasle 


try_lock_until(time_point) 





unique_lock(lockable, N/A 对 新 构建 的 对 : 

duration) 调用 owns_lock(); 
std::unique_lock<TimedLockable> 

unique_lock(lockable, 3 获取 锁 时 返回 true， 

time_point) 返回 false 

try_lock_for(duration) bool 当 获 取 锁 时 返 





try_lock_until(time_point) true > @ M28 wfalse 


当 等 待 超时， 返回 
std::future_status::timec 


BME ES REM > HE 
std::future_status::read) 


wait_for(duration) 


std::future<ValueType> 2 
std::shared_future<ValueType> 
wait_until(time_point) 当 “期 望 " 持 有 一 个 为 BA 
延迟 函数 ， 返 回 
std::future_status::defer 


现在 ， ee 有 : 条 件 变 量 、“ 期 望 *、“ 承 诺 " 还 有 打包 的 任务 。 是 时 候 从 更 高 的 角度 
去 看 待 这 些 机 制 ， 怎 么 样 使 用 这 些 机 制 ， 简 化 线程 的 同步 操作 。 


4.3 限定 等 待 时 间 
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4.4 使 用 同步 操作 简化 代码 


同步 工具 的 使 用 在 本 章 称 为 构建 块 ， 你 可 以 之 关注 那些 需要 同步 的 操作 ， 而 非 具体 使 用 的 机 
制 。 当 需要 为 程序 的 并 发 时 ， 这 是 一 种 可 以 帮助 你 简化 你 的 代码 的 方式 ， 提 供 更 多 的 函数 化 
的 方法 。 比 起 在 多 个 线程 间 直 接 共 享 数据 ， 每 个 任务 拥有 自己 的 数据 会 应 该 会 更 好 ， 并 且 结 
果 可 以 对 其 他 线程 进行 广播 ， 这 就 需要 使 用 “期望 "来 完成 了 。 


4.4.1 使 用 “期 望 ” 的 函数 化 编程 


术语 函数 化 编程 (functional programming) 引 用 于 一 种 编程 方式 ， 这 种 方式 中 的 了 区 数 结果 只 依 
赖 于 传 入 函数 的 参数 ， 并 不 依赖 外 部 状态 。 当 一 个 函数 与 数学 概念 相关 时 ， 当 你 使 用 相同 的 
函数 调用 这 个 函数 两 次 ， 这 两 次 的 结果 会 完全 相同 。 c++ 标准 库 中 很 多 与 数学 相关 的 函数 都 
有 这 个 特性 ， 例 如 ，sin( 正 弦 ),cos( 余 弦 ) 和 和 sqrt( 平 方 根 ) ; 当然 ， 还 有 基本 类 型 间 的 简单 运算 ， 
例如 ，3+3，6*9， 或 1.3/4.7。 一 个 纯粹 的 函数 不 会 改变 任何 外 部 状态 ， 并 且 这 种 特性 完全 限 
制 了 函数 的 返回 值 。 


很 容易 想象 这 是 一 种 什么 样 的 情况 ， 特 别 是 当 并 行 发 生 时 ， 因 为 在 第 三 章 时 我 们 讨论 过 ， 很 
多 问题 发 生 在 共享 数据 上 。 当 共享 数据 没有 被 修改 ， 那 么 就 不 存在 条 件 竟 争 ， 并 且 没 有 必要 
使 用 互 斥 量 去 保护 共享 数据 。 这 可 对 编程 进行 极 大 的 简化 ， 例 如 Haskell 语 言 [2]， 在 Haskell 中 
函数 默认 就 是 这 么 的 “纯粹 ”; 这 种 纯粹 对 的 方式 ， 在 并 发 编程 系统 中 越 来 越 受 欢迎 。 因 为 大 多 
数 函 数 都 是 纯粹 的 ， 那 么 非 纯粹 的 函数 对 共享 数据 的 修改 就 显得 更 为 突出 ， 所 以 其 很 容易 适 
应 应 用 的 整体 结构 。 


函数 化 编程 的 好 处 ， 并 不 限于 那些 将 “纯粹 ”作为 默认 方式 ( 范 型 ) 的 语言 。 cr+ 是 一 个 多 范 型 的 
语言 ， 其 也 可 以 写 出 FP 类 型 的 程序 。 在 cri 中 这 种 方式 要 比 cos 简单 许多 ， 

为 c++11 支持 lambda 表 达 式 ( 详 见 附录 A，A.6 节 )， 还 加 入 了 Boost 和 TR1 中 的 std::bind ， 以 
及 自动 可 以 自行 推断 类 型 的 自动 变量 ( 详 见 附录 A，A.7 节 )。"“ 期 望 "作为 拼图 的 最 后 一 块 ， 它 使 
得 函数 化 编程 模式 并 发 化 (FP-style concurrency) 在 c 中 成 为 可 能 ; 一 个 期望" 对象 可 以 在 

线程 间 互 相传 递 ， 并 允许 其 中 一 个 计算 结果 依赖 于 另外 一 个 的 结果 ， 而 非 对 共享 数据 的 显 式 

访问 。 


快速 排序 FP 模式 版 


为 了 描述 在 函数 化 (PF) 并 发 中 使 用 “期 望 *， 让 我 们 来 看 看 一 个 简单 的 实现 一 一 快速 排序 算法 。 
该 算法 的 基本 思想 很 简单 : 给 定 一 个 数据 列表 ， 然 后 选取 其 中 一 个 数 为 “中 间 ” 值 ， 之 后 将 列表 
中 的 其 他 数值 分 成 两 组 一 组 比 中 间 值 大 ， 另 一 组 比 中 间 值 小 。 之 后 对 小 于 “中 间 ” 值 的 组 进 
行 排 序 ， 并 返回 排序 好 的 列表 ; 再 返回 中间” 值 ; 再 对 比 “ 中 间 ” 值 大 的 组 进行 排序 ， 并 返回 排 
序 的 列表 。 图 4.2 中 展示 了 10 个 整数 在 这 种 方式 下 进行 排序 的 过 程 。 








图 4.2 FP- 模 式 的 递归 排序 


下 面 清单 中 的 代码 是 FP- 模 式 的 顺序 实现 ， 它 需要 传 入 列表 ， 并 且 返 回 一 个 列表 ， 而 非 
与 std::sort() 做 同样 的 事情 ( 译 者 : std::sort() 是 无 返回 值 的 ， 因 为 参数 接收 的 是 迭代 
器 ， 所 以 其 可 以 对 原始 列表 直 进 行 修改 与 排序 。 可 参考 sort()) 


清单 4.12 快速 排序 一 一 顺序 实现 版 


template<typename T> 
std::list<T> sequential_quick_sort(std::list<T> input) 
{ 
if(input.empty()) 
{ 
return input; 
} 
std::list<T> result; 
result.splice(result.begin(),input,input.begin()); // 1 
T const& pivot=*result.begin(); // 2 


auto divide _point=std: :partition(input.begin(),input.end(), 
[&](T const& t){return t<pivot;}); // 3 


std::list<T> lower_part; 
lower_part.splice(lower_part.end(), input, input.begin(), 
divide_point); // 4 
auto new_lower ( 
sequential _quick_sort(std::move(lower_part))); // 


auto new_higher ( 
sequential _quick_sort(std::move(input))); // 6 


result.splice(result.end(),new_higher); // 7 
result.splice(result.begin(),new_lower); // 8 
return result; 


虽然 接口 的 形式 是 FP 模 式 的 ， 但 当 你 使 用 FP 模 式 时 ， 你 需要 做 大 量 的 找 贝 操作 ， 所 以 在 内 部 
你 会 使 用 “普通 "的 命令 模式 。 你 选择 第 一 个 数 为 “< 中间" 值 ， 使 用 splice()@ 将 输入 的 首 个 元 素 (中 
间 值 ) 放 入 结果 列表 中 。 虽 然 这 种 方式 产生 的 结果 可 能 不 是 最 优 的 (会 有 大 量 的 比较 和 交换 操 
作 )， 但 是 对 std::list 做 任何 事 都 需要 花费 较 长 的 时 间 ， 因 为 链表 是 遍历 访问 的 。 你 知道 你 
想 要 什么 样 的 结果 ， 所 以 你 可 以 直接 将 要 使 用 的 “中 间 ? 值 提前 进行 拼接 。 现 在 你 还 需要 使 

用 "中间 ?" 值 进行 比较 ， 所 以 这 里 使 用 了 一 个 引用 @@， 为 了 避免 过 多 的 拷贝 。 之 后 ， 你 可 以 使 
用 std::partition 将 序列 中 的 值 分 成 小 于 “中 间 ” 值 的 组 和 大 于 “中 间 ” 值 的 组 加 。 最 简单 的 方法 
就 是 使 用 ambda 函 数 指 定 区 分 的 标准 ; 使 用 已 获取 的 引用 避免 对 “中 间 " 值 的 拷贝 ( 详 见 附录 
A，A.5 节 ， 更 多 有 关 lambda 函 数 的 信息 ) 。 


std::partition() 对 列表 进行 重 置 ， 并 返回 一 个 指向 首 元 素 ( 不 小 于 “中 间 ?" 值 ) 的 和 迭代 器 。 迁 代 
器 的 类 型 全 称 可 能 会 很 长 ， 所 以 你 可 以 使 用 auto 类 型 说 明 符 ， 让 编译 器 帮助 你 定义 迭代 器 类 
型 的 变量 ( 详 见 附录 A，A.7 节 ) 。 


现在 ， 你 已 经 选择 了 FP 模 式 的 接口 ; 所 以 ， 当 你 要 使 用 递归 对 两 部 分 排序 是 ， 你 将 需要 创建 
两 个 列表 。 你 可 以 用 splice() 元 数 来 做 这 件 事 ， 将 input 列 表 小 于 divided_point 的 值 移动 到 新 列 
表 lower_part@ 中 。 其 他 数 继续 留 在 input 列 表 中 。 而 后 ， 你 可 以 使 用 递归 调用 回回 的 方式 ， 对 
两 个 列表 进行 排序 。 这 里 显 式 使 用 std: :move() 将 列表 传递 到 类 函数 中 ， 这 种 方式 还 是 为 了 避 
免 大 量 的 拷贝 操作 。 最 终 ， 你 可 以 再 次 使 用 splice()， 将 result 中 的 结果 以 正确 的 顺序 进行 拼 
接 。new_higher 指 向 的 值 放 在 “中 间 " 值 的 后 面 D，new lower 指 向 的 值 放 在 “中 间 ? 值 的 前 面 


快速 排序 FP 模式 线程 强化 版 


因为 还 是 使 用 函数 化 模式 ， 所 以 使 用 "期 望 "很 容易 将 其 转化 为 并 行 的 版 本 ， 如 下 面 的 程序 清单 
所 示 。 其 中 的 操作 与 前 面相 同 ， 不 同 的 是 它们 现在 并 行 运行 。 


清单 4.13 快速 排序 一 一 "期望" 并 行 版 


template<typename T> 
std::list<T> parallel _quick_sort(std::list<T> input) 
{ 
if(input.empty()) 
{ 
return input; 
} 
std::list<T> result; 
result.splice(result.begin(),input,input.begin()); 
T const& pivot=*result.begin(); 


auto divide_point=std::partition(input.begin(),input.end(), 
[&](T const& t){return t<pivot;}); 


std::list<T> lower_part; 
lower_part.splice(lower_part.end(),input,input.begin(), 
divide_point); 


std::future<std::list<T> > new_lower( // 1 
std: :async(&parallel_quick_sort<T>,std::move(lower_part))); 


auto new_higher ( 
parallel _quick_sort(std::move(input))); // 2 


result.splice(result.end(),new_higher); // 3 
result.splice(result.begin(),new_lower.get()); // 4 
return result; 


这 里 最 大 的 变化 是 ， 当 前 线程 不 对 小 于 “中 间 ” 值 部 分 的 列表 进行 排序 ， 使 用 std: :async() Ot 
Fy — BAL LATHE o AF ABD RK > ho) ZV BY AF > 1K 3B aH HAT HERO o MUR 
皮 调 用 parallel_quick_sort()， 你 就 可 以 利用 可 用 的 硬件 并 发 了 。 std::async() 会 启动 一 个 新 
线程 ， 这 样 当 你 递归 三 次 时 ， 就 会 有 八 个 线程 在 运行 了 ; 当 你 递归 十 次 (对 于 大 约 有 1000 个 元 
素 的 列表 )， 如 果 硬 件 能 处 理 这 十 次 递归 调用 ， 你 将 会 创建 1024 个 执行 线程 。 当 运行 库 认 为 这 
样 做 产生 了 太 多 的 任务 时 (也 许 是 因为 数量 超过 了 硬件 并 发 的 最 大 值 )， 运 行 库 可 能 会 同步 的 切 
换 新 产生 的 任务 。 当 任务 过 和 响 性 能 )， 这 些 任务 应 该 在 使 用 get() 元 数 获取 的 线程 上 运 
行 ， 而 不 是 在 新 线程 上 运行 ， 这 样 就 能 避免 任务 向 线程 传递 的 开销 。 值 的 注意 的 是 ， 这 完全 
符合 std: :async 的 实现 ， 为 每 一 个 任务 启动 一 个 线程 (甚至 在 任务 超额 时 ; 


在 std::launch::deferred 没有 明确 规定 的 情况 下 ) ; 或 为 了 同步 执行 所 有 任务 
(在 std: :launch: :async AA 确 规定 的 情况 下 )。 当 你 依赖 运行 库 的 自动 缩放 ， 建 议 你 去 查看 一 
下 你 的 实现 文档 ， 了 解 一 下 将 会 有 怎么 样 的 行为 表现 。 


比 起 使 用 std::async() ° 47 VAS —~spawn_task()B 4k 

对 std::packaged_task 和 std::thread 做 简单 的 包装 ， 如 清单 4.14 中 的 代码 所 示 ; 你 需要 为 函 

玫 结 果 创 建 一 个 std::packaged_task 对 象 ， 可 以 从 这 个 对 象 中 获取 “期 望 ”， 或 在 线程 中 执行 

它 ， 返 回 "期 望 *。 其 本 身 并 不 提供 太 多 的 好 处 (并 且 事实 上 会 造成 大 规模 的 超额 任务 )， 但 是 它 

会 为 转型 成 一 个 更 复杂 的 实现 铺 平 道路 ， 将 会 实现 向 一 个 队列 添加 任务 ， 而 后 使 用 线程 池 的 
方式 来 运行 它们 “。 我 们 将 在 第 9 章 再 讨论 线程 池 。 使 用 std: :async 更 适合 于 当 你 知道 你 在 干 

什么 ， 并 且 要 完全 控制 在 线程 池 中 构建 或 执行 过 任务 的 线程 。 


清单 4.14 spawn_task 的 简单 实现 


template<typename F,typename A> 
std: :future<std::result_of<F(A&&)>:: type> 
Spawn_task(F&& f,A&& a) 


typedef std::result_of<F(A&&)>::type result_type; 

std: :packaged_task<result_type(A&&)> 
task(std::move(f))); 

std::future<result_type> res(task.get_future()); 

std::thread t(std::move(task),std::move(a)); 

t.detach(); 

return res; 


其 他 先 不 管 ， 回 到 parallel_ quick sort 函数 。 因 为 你 只 是 直接 递归 去 获取 new_higher 列 表 ， 你 
可 以 如 之 前 一 样 对 new_higher 进 行 拼接 国 。 但 是 ，new_lower 列 表 
是 std::future<std::list<T>> 的 实例 ， 而 非 是 一 个 简单 的 列表 ， 所 以 你 需要 调用 get() 成 员 敬 
数 在 调用 splice()@ 之 前 去 检索 数值 。 在 这 之 后 ， 等 待 后 台 任务 完成 ， 并 且 将 结果 移入 splice() 
调用 中 ; get() 返 回 一 个 包含 结果 的 右 值 引用 ， 所 以 这 个 结果 是 可 以 移出 的 ( 详 见 附录 A，A.1.1 
节 ， 有 更 多 有 关 右 值 引用 和 移动 语义 的 信息 )。 


即使 假设 ， 使 用 std::async() 是 对 可 用 硬件 并 发 最 好 的 选择 ， 但 是 这 样 的 并 行 实现 对 于 快速 
排序 来 说 ， 依 然 不 是 最 理想 的 。 其 中 ， std::partition 做 了 很 多 工作 ， 即 使 做 了 依 昌 是 顺序 
调用 ， 但 就 现在 的 情况 来 说 ， 已 经 足够 好 了 。 如 果 你 对 实现 最 快 并 行 的 可 能 性 感 兴 趣 的 话 ， 

你 可 以 去 查阅 一 些 学 术 文 献 。 

因为 避 开 了 共享 易 变 数据 ， 函 数 化 编程 可 算 作 是 并 发 编程 的 范 型 ; 并 且 也 是 通讯 顺序 进程 


(CSPCommunicating Processer[3],) 的 范 型 ， 这 里 线程 理论 上 是 完全 分 开 的 ， 也 
就 是 没有 共享 数据 ， 但 是 有 通讯 通道 允许 信息 在 不 同 线程 间 进 行 传递 。 这 种 范 型 被 Erlang 语 言 


所 采纳 ， 并 且 在 MPI(Message Passing /nterfece， 消 息 传递 接口 ) 上 常用 来 做 C 和 c++ 的 高 性 
能 运算 。 现 在 你 应 该 不 会 在 对 学 习 它 们 而 感到 惊奇 了 吧 ， 因 为 只 需 遵 守 一 些 约定 om 就 能 
支持 它们 ; 在 接 下 来 的 一 节 中 ， 我 们 会 讨论 实现 这 种 方式 。 


4.4.2 使 用 消息 传递 的 同步 操作 


CSP 的 概念 十 分 简单 : 当 没 有 共享 数据 ， 每 个 线程 就 可 以 进行 独立 思考 ， 其 行为 纯粹 基于 其 
所 接收 到 的 信息 。 每 个 线程 就 都 有 一 个 状态 机 : 当 线 程 收 到 一 条 信息 ， 它 将 会 以 某 种 方式 更 
新 其 状态 ， 并 且 可 能 向 其 他 线程 发 出 一 条 或 多 条 信息 ， 对 于 消息 的 处 理 依赖 于 线程 的 初始 化 
状态 。 这 是 一 种 正式 写 入 这 些 线程 的 方式 ， 并 且 以 有 限 状 态 机 的 模式 实现 ， 但 是 这 不 是 唯一 
的 方案 ; 状态 机 可 以 在 应 用 程序 中 隐 式 实现 。 这 种 方法 咋 任何 给 定 的 情况 下 ， 都 更 加 依赖 于 
特定 情形 下 明确 的 行为 要 求 和 编程 团队 的 专业 知识 。 无 论 你 选择 用 什么 方式 去 实现 每 个 线 
程 ， 任 务 都 会 分 成 独立 的 处 理 部 分 ， 这 样 会 消除 潜在 的 混乱 (数据 共享 并 发 )， 这 样 就 让 编程 变 
的 更 加 简单 ， 且 拥有 低 错误 率 。 


站 正 通讯 顺序 处 理 是 没有 共享 数据 的 ， 所 有 消息 都 是 通过 消息 队列 传递 ， 但 是 因为 ct+ 线程 
共享 一 块 地址 空间 ， 所 以 达 不 到 摊 正 通讯 顺序 处 理 的 要 求 。 这 里 就 需要 有 一 些 约定 了 : 作为 
一 款 应 用 或 者 是 一 个 库 的 作者 ， 我 们 有 责任 确保 在 我 们 的 实现 中 ， 线 程 不 存在 共享 数据 。 当 
然 ， 为 了 线程 间 的 通信 ， 消 息 队 列 是 必须 要 共享 的 ， 具 体 的 细节 可 以 包含 在 库 中 。 


试想 ， 有 一 天 你 要 为 实现 ATM( 自 动 取款 机 ) 写 一 段 代码 。 这 段 代码 需要 处 理 ， 人 们 尝试 取 钱 时 
和 银行 之 间 的 交互 情况 ， 以 及 控制 物理 器 械 接受 用 户 的 卡片 ， 显 示 适 当 的 信息 ， 处 理 按钮 事 
件 ， 吐 出 现金 ， 还 有 退还 用 户 的 卡 。 


一 种 处 理 所 有 事情 的 方法 是 让 代码 将 所 有 事情 分 配 到 三 个 独立 线程 上 去 : 一 个 线程 去 处 理 物 
理 机 械 ， 一 个 去 处 理 ATM 机 的 逻辑 ， 还 有 一 个 用 来 与 银行 通讯 。 这 些 线程 可 以 通过 信息 进行 
纯粹 的 通讯 ， 而 非 共享 任何 数据 。 比 如 ， 当 有 人 在 ATM 机 上 插入 了 卡片 或 者 按 下 按钮 ， 处 理 
物理 机 械 的 线程 将 会 发 送 一 条 信息 到 逻辑 线程 上 ， 并 且 人 逻辑 线 程 将 会 发 送 一 条 消息 到 机 械 线 
程 ， 告 诉 机 械 线 程 可 以 分 配 多 少 钱 ， 等 等 。 


一 种 为 ATM 机 逻辑 建 模 的 方式 是 将 其 当做 一 个 状态 机 。 线 程 的 每 一 个 状态 都 会 等 待 一 条 可 接 
受 的 信息 ， 这 条 信息 包含 需要 处 理 的 内 容 。 这 可 能 会 让 线程 过 渡 到 一 个 新 的 状态 ， 并 且 循环 
继续 。 在 图 4.3 中 将 展示 ， 有 状态 参与 的 一 个 简单 是 实现 。 在 这 个 简化 实现 中 ， 系 统 在 等 待 一 
张 卡 插入 。 当 有 卡 插入 时 ， 系 统 将 会 等 待 用 户 输入 它 的 PIN( 类 似 身 份 码 的 东西 )， 每 次 输入 一 
个 数字 。 用 户 可 以 将 最 后 输入 的 数字 删除 。 当 数字 输入 完成 ，PIN 就 需要 验证 。 当 验证 有 问 
题 ， 你 的 程序 就 需要 终止 ， 就 需要 为 用 户 退 出 卡 ， 并 且 继 续 等 待 其 他 人 将 卡 插入 到 机 器 中 。 
当 PIN 验 证 通过 ， 你 的 程序 要 等 待 用 户 取消 交易 或 选择 取款 。 当 用 户 选择 取消 交易 ， 你 的 程序 
就 可 以 结束 ， 并 返还 卡片 。 当 用 户 选 择 取 出 一 定量 的 现金 ， 你 的 程序 就 要 在 吐出 现金 和 返还 
卡片 前 等 待 银行 方面 的 确认 ， 或 显示 “余额 不 足 ”" 的 信息 ， 并 返还 卡片 。 很 明显 ， 一 个 真正 的 
ATM 机 要 考虑 的 东西 更 多 、 更 复杂 ， 但 是 我 们 来 说 这 样 描述 已 经 足够 了 。 


B 输入 激 字 (最 终 输 入 ) 
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图 4.3 一 台 ATM 机 的 状态 机 模型 (简化 ) 

我 们 已 经 为 你 的 ATM 机 逮 辑 设计 了 一 个 状态 机 ， 你 可 以 使 用 一 个 类 实现 它 ， 这 个 类 中 有 一 个 
成 员 函 数 可 以 代表 每 一 个 状态 。 每 一 个 成 员 函 数 可 以 等 待 从 指定 集合 中 传 入 的 信息 ， 以 及 当 
他 们 到 达 时 进行 处 理 ， 这 就 有 可 能 触发 原始 状态 向 另 一 个 状态 的 转化 。 每 种 不 同 的 信息 类 型 
由 一 个 独立 的 Struct 表 示 。 清 单 4.15 展 示 了 ATM 逻 辑 部 分 的 简单 实现 (在 以 上 描述 的 系统 中 ， 有 
主 循环 和 对 第 一 状态 的 实现 )， 并 且 一 直 在 等 待 卡片 插入 。 

如 你 所 见 ， 所 有 信息 传递 所 需 的 的 同步 ， 完 全 包含 在 “信息 传递 " 库 中 (基本 实现 在 附录 C 中 ， 是 
清单 4.15 代 码 的 完整 版 ) 


清单 4.15 ATM 逮 辑 类 的 简单 实现 


struct card_inserted 


{ 
std::string account; 
}; 
class atm 
{ 


messaging::receiver incoming; 
messaging::sender bank; 
messaging::sender interface_hardware; 


void (atm::*state)(); 


std::string account; 
std::string pin; 


void waiting_for_card() // 1 
{ 
interface_hardware.send(display_enter_card()); // 2 
incoming.wait(). // 3 
handle<card_inserted>( 
[&](card_inserted const& msg) // 4 
{ 
account=msg.account; 
pin=""; 
interface_hardware.send(display_enter_pin()); 
state=&atm: :getting_pin; 


} 
); 
} 
void getting_pin(); 
public: 
void run() // 5 
{ 
state=&atm: :waiting_for_card; // 6 
try 
{ 
for(;;) 
{ 
(this->*state)(); // 7 
} 
} 
catch(messaging::close_queue const&) 
{ 
} 


} 
ie 


如 之 前 提 到 的 ， 这 个 实现 对 于 实际 ATM 机 的 逻辑 来 说 是 非常 简单 的 ， 但 是 他 能 让 你 感受 到 信 
息 传递 编程 的 方式 。 这 里 无 需 考 虑 同步 和 并 发 问题 ， 只 需要 考虑 什么 时 候 接 收 信息 和 发 送信 
息 即 可 。 为 ATM 逮 辑 所 设 的 状态 机 运行 在 独立 的 线程 上 ， 与 系统 的 其 他 部 分 一 起 ， 比 如 与 银 


行 通讯 的 接口 ， 以 及 运行 在 独立 线程 上 的 终端 接口 。 这 种 程序 设计 的 方式 被 称 为 参与 者 模 
式 (Actor model) 一 一 在 系统 中 有 很 多 独立 的 (运行 在 一 个 独立 的 线程 上 ) 参 与 者 ， 这 些 参 与 者 会 
互相 发 送信 息 ， 去 执行 手头 上 的 任务 ， 并 且 它 们 不 会 共享 状态 ， 除 非 是 通过 信息 直接 传 入 

的 。 


运行 从 run() 成 员 函 数 开始 回 ， 其 将 会 初始 化 waiting_for_card@@ 的 状态 ， 然 后 反复 执行 当前 状 
态 的 成 员 函 数 (无 论 这 个 状态 时 怎么 样 的 )D。 状 态 函 数 是 简易 atm 类 的 成 员 芳 数 。 
wait_for_card 骂 数 @ 依 昌 很 简单 : 它 发 送 一 条 信息 到 接口 ， 让 终端 显示 “等待 卡 片 " 的 信息 @ > 
之 后 就 等 待 传 入 一 条 消息 进行 处 理 国 。 这 里 处 理 的 消息 类 型 只 能 是 card_inserted 类 的 ， 这 里 
使 用 一 个 lambda 函 数 @ 对 其 进行 处 理 。 当 然 ， 你 可 以 传递 任何 函数 或 函数 对 象 ， 去 处 理 函 
数 ， 但 对 于 一 个 简单 的 例子 来 说 ， 使 用 lambda 表 达 式 是 最 简单 的 方式 。 注 意 handle() 函 数 调 
用 是 连接 到 wait() 函 数 上 的 ; 当 收 到 的 信息 类 型 与 处 理 类 型 不 匹配 ， 收 到 的 信息 会 被 丢弃 ， 并 
且 线 程 继 续 等 待 ， 直 到 接收 到 一 条 类 型 匹配 的 消息 。 


lambda 元 数 自身 ， 只 是 将 用 户 的 账号 信息 缓存 到 一 个 成 员 变 量 中 去 ， 并 且 清 除 PIN 信 息 ， 再 
发 送 一 条 消息 到 硬件 接口 ， 让 显示 界面 提示 用 户 输 入 PIN， 然 后 将 线程 状态 改 为 “获取 PIN”。 
当 消 息 处 理 程序 结束 ， 状 态 函 数 就 会 返回 ， 然 后 主 循 环 会 调用 新 的 状态 函数 中 。 


如 图 4.3，getting_pin 状 态 函 数 会 负载 一 些 ， 因 为 其 要 处 理 三 个 不 同 的 信息 类 型 。 具 体 代码 展 
示 如 下 : 


清单 4.16 简单 ATM 实 现 中 的 getting_pin 状 态 函 数 


void atm: :getting_pin() 
{ 
incoming.wait() 
.handle<digit_pressed>( // 1 
[&](digit_pressed const& msg) 
{ 
unsigned const pin_length=4; 
pin+=msg.digit; 
if(pin.length()==pin_length) 
{ 
bank.send(verify_pin(account, pin, incoming) ); 
state=&atm: : verifying _pin; 


} 
) 


.handle<clear_last_pressed>( // 2 
[&](clear_last_pressed const& msg) 
{ 
if(!pin.empty()) 
{ 
pin.resize(pin.length()-1); 


} 
) 


.handle<cancel_pressed>( // 3 
[&](cancel_pressed const& msg) 
{ 
state=&atm: :done_processing; 
} 
); 


这 次 需要 处 理 三 种 消息 类 型 ， 所 以 wait() 函 数 后 面 接 了 三 个 handle() 函 数 调 用 @@@ 4A 
handle() 都 有 对 应 的 消息 类 型 作为 模板 参数 ， 并 且 将 消息 传 入 一 个 lambda 兄 数 中 (其 获取 消息 
类 型 作为 一 个 参数 )。 因 为 这 里 的 调用 都 被 连接 在 了 一 起 ，wait() 的 实现 知道 它 是 等 待 一 条 

digit_pressed 消 息 ， 或 是 一 条 clear_last_pressed 肖 息 ， 亦 或 是 一 条 cancel pressed 消 息 ， 其 


他 的 消息 类 型 将 会 被 丢弃 。 


这 次 当 你 获取 一 条 消息 时 ， 无 需 再 去 改变 状态 。 比 如 ， 当 你 获取 一 条 digit_pressed 消 息 时 ， 

你 仅 需 要 将 其 添加 到 pin 中 ， 除 非 那 些 数字 是 最 终 的 输入 。( 清 单 4.15 中 ) 主 循环 @ 将 会 再 次 调用 

getting_pin() 去 等 待 下 一 个 数字 (或 清除 数字 ， 或 取消 交易 )。 

这 里 对 应 的 动作 如 图 4.3 所 示 。 每 个 状态 盒 的 实现 都 由 一 个 不 同 的 成 员 有 函数 构成 ， 等 待 相 关 信 
息 并 适当 的 更 新 状态 。 


如 你 所 见 ， 在 一 个 并 发 系统 中 这 种 编程 方式 可 以 极 大 的 简化 任务 的 设计 ， 因 为 每 一 个 线程 都 
完全 被 独立 对 待 。 因 此 ， 在 使 用 多 线程 去 分 离 关注 点 时 ， 需 要 你 明确 如 何 分 配 线程 之 间 的 任 


o 


we 
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4.5 ABR 


同步 操作 对 于 使 用 并 发 编写 一 款 多 线程 应 用 来 说 ， 是 很 重要 的 一 部 分 : 如 果 没 有 同步 ， 线 程 
基本 上 就 是 独立 的 ， 也 可 写成 单独 的 应 用 ， 因 其 任务 之 间 的 相关 性 ， 它 们 可 作为 一 个 群体 直 
接 执行 。 本 章 ， 我 们 讨论 了 各 式 各 样 的 同步 操作 ， 从 基本 的 条 件 变 量 ， 到 "期望"、“ 承 诺 "， 再 
到 打包 任务 。 我 们 也 讨论 了 替代 同步 的 解决 方案 : 函数 化 模式 编程 ， 完 全 独立 执行 的 函数 ， 
不 会 受到 外 部 环境 的 影响 ; 还 有 ， 消 息 传递 模式 ， 以 消息 子 系统 为 中 介 ， 向 线程 异步 的 发 送 
消息 。 


我 们 已 经 讨论 了 很 多 C++ 中 的 高 层 工具 ， 现 在 我 们 来 看 一 下 底层 工具 是 如 何 让 一 切 都 工作 的 : 
C++ 内 存 模型 和 原子 操作 。 


第 5 章 C++ 内 存 模型 和 原子 类 型 操作 


本 章 主要 内 容 


© C++11 内 存 模型 详解 

。 标准 库 提 供 的 原子 类 型 

e 使 用 各 种 原子 类 型 

© 原子 操作 实现 线程 同步 功能 


C++11 标 准 中 ， 有 一 个 十 分 重要 特性 ， 常 被 程序 员 们 所 和 忽略。 它 不 是 一 个 新 语法 特性 ， 也 不 是 
新 工具 ， 它 就 是 多 线程 (感知 ) 内 存 模 型 。 内 存 模型 没有 明确 的 定义 基本 部 件 应 该 如 何 工作 的 

话 ， 之 前 介绍 的 那些 工具 就 无 法 正常 工作 。 那 为 什么 大 多 数 程序 员 都 没有 注意 到 它 呢 ? 当 你 

使 用 互 斥 量 保护 你 的 数据 和 条 件 变 量 ， 或 者 是 "期望 "上 的 信号 事件 时 ， 对 于 互 斤 量 为 什么 能 起 
到 这 样 作用 ， 大 多 数 人 不 会 去 关心 。 只 有 当 你 试图 去 “接触 硬件 ”"， 你 才能 详尽 的 了 解 到 内 存 模 
型 是 如 何 起 作用 的 。 


C++ 是 一 个 系统 级 别 的 编程 语言 ， 标 准 委员 会 的 目标 之 一 就 是 不 需要 比 ct+ 还 要 底层 的 高 级 
语言 。 c++ 应 该 向 程序 员 提 供 足 够 的 灵活 性 ， 无 障碍 的 去 做 他 们 想 要 做 的 事情 ; 当 需 要 的 时 
候 ， 可 以 让 他 们 "接触 硬件 "。 原 子 类 型 和 原子 操作 就 允许 他 们 "接触 硬件 "， 并 提供 底层 级 别 的 
同步 操作 ， 通 常会 将 常规 指令 数 缩减 到 1~2 个 CPU 指令 。 


本 章 ， 我 们 将 讨论 内 存 模型 的 基本 知识 ， 而 后 再 了 解 一 下 原子 类 型 和 操作 ， 最 后 了 解 与 原子 
类 型 操作 相关 的 各 种 同步 。 这 个 过 程 会 比较 复杂 : 除非 你 已 经 打算 使 用 原子 操作 (比如 ， 第 7 章 
的 无 锁 数 据 结构 ) 同 步 你 的 代码 ， 否 则 ， 就 没有 必要 了 解 过 多 的 细节 。 


让 我 们 先 轻 松 愉快 的 来 看 一 下 有 关内 存 模 型 的 基本 知识 。 


5.1 内 存 模 型 基础 


这 里 从 两 方面 来 讲 内 存 模型 : 一 方面 是 基本 结构 ， 这 与 事务 在 内 存 中 是 怎样 布局 的 有 关 ; 另 
一 方面 就 是 并 发 。 对 于 并 发 基本 结构 很 重要 ， 特 别 是 在 低层 原子 操作 。 所 以 我 将 会 从 基本 结 
构 讲 起 。 c++ 中 它 与 所 有 的 对 象 和 内 存 位 置 有 关 。 


5.1.1 对 象 和 内 和 存 位 置 


在 一 个 c++ 程序 中 的 所 有 数据 都 是 由 对 象 (objects) 构 成 。 这 不 是 说 你 可 以 创建 一 个 int 的 衍生 
类 ， 或 者 是 基本 类 型 中 存在 有 成 员 函 数 ， 或 是 像 在 Smalltalk 和 Ruby 语 言 下 讨论 程序 那样 

一 一 “一切 都 是 对 象 "。“ 对 象 " 仅 仅 是 对 C++ 数据 构建 块 的 一 个 声明 。 c++ 标准 定义 类 对 象 为 " 存 
储 区 域 ”， 但 对 象 还 是 可 以 将 自己 的 特性 赋予 其 他 对 象 ， 比 如 ， 其 类 型 和 生命 周期 。 


像 int 或 float 这 样 的 对 象 就 是 简单 基本 类 型 ; 当然 ， 也 有 用 户 定 义 类 的 实例 。 一 些 对 象 (比如 ， 
数组 ， 衍 生 类 的 实例 ， 特 殊 (具有 非 静 态 数 据 成 员 ) 类 的 实例 ) 拥 有 子 对 象 ， 但 是 其 他 对 象 就 
没有 。 


无 论 对 象 是 怎么 样 的 一 个 类 型 ， 一 个 对 象 都 会 存储 在 一 个 或 多 个 内 存 位 置 上 。 每 一 个 内 存 位 
置 不 是 一 个 标量 类 型 的 对 象 ， 就 是 一 个 标量 类 型 的 子 对 象 ， 比 如 ，unsigned short ` 
my_class* 或 序列 中 的 相 邻 位 域 。 当 你 使 用 位 域 ， 就 需要 注意 : 虽然 相 邻 位 域 中 是 不 同 的 对 

象 ， 但 仍 视 其 为 相同 的 内 存 位 置 。 如 图 5.1 所 示 ， 将 一 个 struct 分 解 为 多 个 对 象 ， 并 且 展 示 了 每 
个 对 象 的 内 存 位 置 。 
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图 5.1 分 解 一 个 struct， 展 示 不 同 对 象 的 内 存 位 置 


首先 ， 完 整 的 struct 是 一 个 有 多 个 子 对 象 (每 一 个 成 员 变 量 ) 组 成 的 对 象 。 位 域 bf1 和 bf2 共 享 同一 
个 内 存 位 置 (int 是 4 字 节 32 位 类 型 ) ， 并且 sta: :string 类 型 的 对 象 s 由 内 部 多 个 内 存 位 置 组 
成 ， 但 是 其 他 的 每 个 成 员 都 拥有 自己 的 内 存 位 置 。 注 意 ， 位 域 宽度 为 0 的 bf3 是 如 何 与 bf4 分 
离 ， 并 拥有 各 自 的 内 存 位 置 的 。( 译 者 注 : 图 中 bf3 是 一 个 错误 展示 ， 在 c++ 和 C 中 规定 ， 宽 度 
为 0 的 一 个 未 命名 位 域 强制 下 一 位 域 对 齐 到 其 下 一 type 边 界 ， 其 中 type 是 该 成 员 的 类 型 。 这 里 
使 用 命名 变量 为 0 的 位 域 ， 可 能 只 是 想 展 示 其 与 bf4 是 如 何 分 离 的 。 有 关 位 域 的 更 多 可 以 参 
考 Wiki 的 页 面 )。 
这 里 有 四 个 需要 牢记 的 原则 : 

1. 每 一 个 变量 都 是 一 个 对 象 ， 包 括 作为 其 成 员 变 量 的 对 象 。 

2. 每 个 对 象 至 少 占 有 一 个 内 存 位 置 。 

3. 基本 类 型 都 有 确定 的 内 存 位 置 (无 论 类 型 大 小 如 何 ， 即 使 他 们 是 相 邻 的 ， 或 是 数组 的 一 部 


分 ) 。 


4.， 相 邻 位 域 是 相同 内 存 中 的 一 部 分 。 


我 确定 你 会 好 奇 ， 这 些 在 并 发 中 有 什么 作用 ， 那 么 下 面 就 让 我 们 来 见识 一 下 。 


5.1.2 对 象 、 内 和 存 位 置 和 并 发 


这 部 分 对 于 c 的 多 线程 应 用 来 说 是 至 关 重 要 的 : 所 有 东西 都 在 内 存 中 。 当 两 个 线程 访问 不 
同 的 内 存 位 置 时 ， 不 会 存在 任何 问题 ， 一 切 都 工作 顺利 。 而 另 一 种 情况 下 ， 当 两 个 线程 访问 
同一 个 内 存 位 置 ， 你 就 要 小 心 了 。 如 果 没 有 线程 更 新 内 存 位 置 上 的 数据 ， 那 还 好 ; 只 读数 据 
不 需要 保护 或 同步 。 当 有 线程 对 内 存 位 置 上 的 数据 进行 修改 ， 那 就 有 可 能 会 产生 条 件 竞 争 ， 
就 如 第 3 章 所 述 的 那样 。 


为 了 避免 条 件 竞争 ， 两 个 线程 就 需要 一 定 的 执行 顺序 。 第 一 种 方式 ， 如 第 3 章 所 述 那 样 ， 使 用 
互 斥 量 来 确定 访问 的 顺序 ; 当 同 一 互 不 量 在 两 个 线程 同时 访问 前 被 锁 住 ， 那 么 在 同一 时 间 内 
就 只 有 一 个 线程 能 够 访问 到 对 应 的 内 存 位置 ， 所 以 后 一 个 访问 必须 在 前 一 个 访问 之 后 。 另 一 
种 方式 是 使 用 原子 操作 同步 机 制 ( 详 见 5.2 节 中 对 于 原子 操作 的 定义 )， 决 定 两 个 线程 的 访问 顺 
序 。 使 用 原子 操作 来 规定 顺序 在 5.3 节 中 会 有 介绍 。 当 多 于 两 个 线程 访问 同一 个 内 存 地 址 时 ， 
对 每 个 访问 这 都 需要 定义 一 个 顺序 。 


如 果 不 去 规定 两 个 不 同 线程 对 同一 内 存 地 址 访问 的 顺序 ， 那 么 访问 就 不 是 原子 的 ; 并 且 ， 当 
两 个 线程 都 是 "作者" 时， 就 会 产生 数据 竞争 和 未 定义 行为 。 


以 下 的 声明 由 为 重要 : 未 定义 的 行为 是 ce 中 最 黑暗 的 角落 。 根 据 语言 的 标准 ， 一 旦 应 用 中 
有 任何 未 定义 的 行为 ， 就 很 难 预料 会 发 生 什么 事情 ; 因为 ， 未 定义 行为 是 难以 预料 的 。 我 就 
知道 一 个 未 定义 行为 的 特定 实例 ， 让 某 人 的 显示 器 起 火 的 案例 。 虽 然 ， 这 种 事情 应 该 不 会 发 
生 在 你 身上 ， 但 是 数据 竞争 绝对 是 一 个 严重 的 错误 ， 并 且 需 要 不 惜 一 切 代价 加 免 它 。 


另 一 个 重点 是 : 当 程 序 中 的 对 同一 内 存 地 址 中 的 数据 访问 存在 竞争 ， 你 可 以 使 用 原子 操作 来 
避免 未 定义 和 行为。 当然， 这 不 会 影响 竞争 的 产生 一 一 原子 操作 并 没有 指定 访问 顺序 一 一 但 原 
子 操作 把 程序 拉 回 了 定义 行为 的 区 域内 。 


在 我 们 了 解 原子 操作 前 ， 还 有 一 个 有 关 对 象 和 内 存 地 址 的 概念 需要 重点 了 解 : 修改 顺序 。 


5.1.3 修改 顺序 


每 一 个 在 C++ 程序 中 的 对 象 ， 都 有 (由 程序 中 的 所 有 线程 对 象 ) 确 定好 的 修改 顺序 ， 在 的 初始 化 
开始 阶段 确定 。 在 大 多 数 情况 下 ， 这 个 顺序 不 同 于 执行 中 的 顺序 ， 但 是 在 给 定 的 执行 程序 
中 ， 所 有 线程 都 需要 遵守 这 顺序 。 如 果 对 象 不 是 一 个 原子 类 型 (将 在 5.2 节 详 述 )， 你 必要 确保 
有 足够 的 同步 操作 ， 来 确定 每 个 线程 都 遵守 了 变量 的 修改 顺序 。 当 不 同 线程 在 不 同 序列 中 访 
问 同一 个 值 时 ， 你 可 能 就 会 遇 到 数据 竞争 或 未 定义 行为 ( 详 见 5.1.2 节 )。 如 果 你 使 用 原子 操作 ， 
编译 器 就 有 责任 去 替 你 做 必要 的 同步 。 


这 一 要 求 意味 着 : 投机 执行 是 不 允许 的 ， 因 为 当 线 程 按 修改 顺序 访问 一 个 特殊 的 输入 ， 之 后 
的 读 操 作 ， 必 须 由 线程 返回 较 新 的 值 ， 并 且 之 后 的 写 操作 必须 发 生 在 修改 顺序 之 后 。 同 样 
的 ， 在 同一 线程 上 人 允许 读 取 对 象 的 操作 ， 要 不 返回 一 个 已 写 入 的 值 ， 要 不 在 对 象 的 修改 顺序 
后 (也 就 是 在 读 取 后 ) 再 写 入 另 一 个 值 。 虽 然 ， 所 有 线程 都 需要 遵守 程序 中 每 个 独立 对 象 的 修改 
顺序 ， 但 它们 没有 必要 遵守 在 独立 对 象 上 的 相对 操作 顺序 。 在 5.3.3 节 中 会 有 更 多 关于 不 同 线 
程 间 操 作 顺 序 的 内 容 。 


所 以 ， 什 么 是 原子 操作 ? 它 如 何 来 规定 顺序 ? 接 下 来 的 一 节 中 ， 会 为 你 揭晓 答案 。 


5.2 c++ 中 的 原子 操作 和 原子 类 型 


原子 操作 是 个 不 可 分 割 的 操作 。 在 系统 的 所 有 线程 中 ， 你 是 不 可 能 观察 到 原子 操作 完成 了 一 

半 这 种 情况 的 ; 它 要 么 就 是 做 了 ， 要 么 就 是 没 做 ， 只 有 这 两 种 可 能 。 如 果 从 对 象 读 取 值 的 加 

载 操作 是 原子 的 ， 而 且 对 这 个 对 象 的 所 有 修改 操作 也 是 原子 的 ， 那 么 加 载 操作 得 到 的 值 要 
么 是 对 象 的 初始 值 ， 要 么 是 某 次 修改 操作 存 入 的 值 。 


另 一 方面 ， 非 原子 操作 可 能 会 被 另 一 个 线程 观察 到 只 完成 一 半 。 如 果 这 个 操作 是 一 个 存储 操 
作 ， 那 么 其 他 线程 看 到 的 值 ， 可 能 既 不 是 存储 前 的 值 ， 也 不 是 存储 的 值 ， 而 是 别 的 什么 值 。 
如 果 这 个 非 原 子 操作 是 一 个 加 载 操 作 ， 它 可 能 先 取 到 对 象 的 一 部 分 ， 然 后 值 被 另 一 个 线程 修 
改 ， 然 后 它 再 取 到 剩余 的 部 分 ， 所 以 它 取 到 的 既 不 是 第 一 个 值 ， 也 不 是 第 二 个 值 ， 而 是 两 个 
值 的 某 种 组 合 。 正 如 第 三 章 所 讲 的 ， 这 一 下 成 了 一 个 容易 出 问题 的 竞争 冒险 ， 但 在 这 个 层面 
上 它 可 能 就 构成 了 数据 竞争 (A517) ， 就 成 了 未 定义 行为 。 


在 ct+ 中 ， 多 数 时 候 你 需要 一 个 原子 类 型 来 得 到 原子 的 操作 ， 我 们 来 看 一 下 这 些 类 型 。 


1 标准 原子 类 型 


标准 原子 类 型 定义 在 头 文件 <atomic> Po 这 些 类 型 上 的 所 有 操作 都 是 原子 的 ， 在 语言 定义 
中 只 有 这 些 类 型 的 操作 是 原子 的 ， 不 过 你 可 以 用 互 斥 锁 来 模拟 原子 操作 。 实际 上 ， 标 准 原子 
类 型 自己 的 实现 就 可 能 是 这 样 模拟 出 来 的 : 它们 (几乎 ) 都 有 一 个 is_lock_free() 成 员 函数 ， 
这 个 函数 让 用 户 可 以 查 询 某 原子 类 型 型 的 操作 是 直接 用 的 原子 指令 ( x.is_lock_free() 返 


回 true )， 还 是 编译 器 和 库 内 部 用 了 一 个 锁 ( x.is_lock_free() 返回 false )。 


只 用 std::atomic_flag 类 型 不 提供 is_lock free() 成 员 有 函数 。 

志 ， 并 且 在 这 种 类 型 上 的 操作 都 需要 是 无 锁 的 ; 当 你 有 一 个 简单 无 锁 的 布尔 标志 时 ， 
使 用 其 实现 一 个 简单 的 锁 ， 并 且 实 现 其 他 基础 的 原子 类 型 。 当 你 觉得 “ 旧 单 " 时 ， 就 说 
明 :在 std::atomic flag 对 象 明 确 初 始 化 后 ， 做 查询 和 设置 (使 用 test_and_set() 成 员 有 函数 )， 
或 清除 (使 用 clear() 成 员 函 数 ) 都 很 容易 。 这 就 是 : 无 赋值 ， 无 拷贝 ， 没 有 测试 和 清除 ， 没 有 其 
他 任何 操作 。 


剩 下 的 原子 类 型 都 可 以 通过 特 化 std: :atomic<> 类 型 模板 而 访问 到 ， 并 且 拥 有 更 多 的 功能 ， 但 
可 能 不 都 是 无 锁 的 (如 之 前 解释 的 那样 ) 。 在 最 流行 的 平台 上 ， 期 望 原子 变 dee ins 
型 (例如 std::atomic<int> 和 std::atomic<void*> )? ， 但 这 没有 必要 。 你 在 后 面 将 会 看 到 ， 

特 化 接口 所 反映 出 的 类 型 特点 ; 位 操作 (如 &=) 就 没有 为 普通 指针 所 定义 ， 所 以 它 也 就 不 外 eR 
子 指针 所 定义 。 


直接 使 用 std: :atomic<> 类 型 模板 外 > 你 可 以 使 用 在 表 5. 1 中 所 示 的 原子 类 型 集 。 由 于 历 
史 原 因 ， 原 子 类 型 已 经 添加 入 c++ 标准 中 ， 这 些 备 选 类 型 名 可 能 参考 相应 
的 std: :atomic<> 特 化 类 型 或 是 特 化 的 基 类 。 。 在 同一 程序 中 混合 使 用 备 选 名 


与 std::atomic<> 特 化 类 名 ， 会 使 代码 的 移植 大 打折 扣 。 


表 5.1 标准 原子 类 型 的 备 选 名 和 与 其 相关 的 std: :atomic<> 特 化 类 


原子 类 型 相关 特 化 类 
atomic_bool std::atomic<bool> 
atomic_char std::atomic<char> 
atomic_schar std::atomic<signed char> 
atomic_uchar std::atomic<unsigned char> 
atomic_int std::atomic<int> 
atomic_uint std::atomic<unsigned> 
atomic_short std::atomic<short> 
atomic_ushort std::atomic<unsigned short> 
atomic_long std::atomic<long> 
atomic_ulong std::atomic<unsigned long> 
atomic_llong std::atomic<long long> 
atomic_ullong std::atomic<unsigned long long> 
atomic_char16 t std::atomic<char16_t> 
atomic_char32_t std::atomic<char32_t> 
atomic_wchar_t std::atomic<wchar_t> 


C++ 标 准 库 不 仅 提 供 基本 原子 类 型 ， 还 定义 了 与 原子 类 型 对 应 的 非 原子 类 型 ， 就 如 同 标准 库 中 
的 std::size t 。 如 表 5.2 所 示 这 些 类 型 : 


= 


表 5.2 标准 原子 类 型 定义 (typedefs) 和 对 应 的 内 置 类 型 定义 (typedefs) 


原子 类 型 定 》 


atomic_int_least8_t 
atomic_uint_least8_t 
atomic_int_least16_t 
atomic_uint_least16_t 
atomic_int_least32_t 
atomic_uint_least32_t 
atomic_int_least64_t 
atomic_uint_least64_t 
atomic_int_fast8_t 
atomic_uint_fast8_t 
atomic_int_fast16_t 
atomic_uint fast16 t+ 
atomic_int_fast32_t 
atomic_uint_fast32_t 
atomic_int_fast64 t+ 
atomic_uint fast64 t+ 
atomic_intptr_t 
atomic_uintptr_t 
atomic_size_t 
atomic_ptrdiff_t 
atomic_intmax_t 


atomic_uintmax_t 


标准 库 中 相关 类 型 定义 


int_least8_t 
uint_least8_t 
int_least16_ t 
uint_least16_t 
int_least32_t 
uint_least32_t 
int_least64_ t 
uint_least64_t 
int_fast8_t 
uint_fast8_t 
int_fast16_t 
uint_fast16_t 
int_fast32_t 
uint_fast32_t 
int_fast64_t 
uint_ fast64 + 
intptr_t 
uintptr_t 
size_t 

ptrdiff_t 
intmax_t 


uintmax_t 


好 多 种 类 型 | 不 过 ， 它 们 有 一 个 相当 简单 的 模式 ; 对 于 标准 类 型 进行 typedef T， 相 关 的 原子 
类 型 就 在 原来 的 类 型 名 前 加 上 atomic 的 前 级 : atomic T。 除 了 singed 类 型 的 缩写 是 s， 
unsigned 的 缩写 是 u， 和 |ong long 的 缩写 是 llong 之 外 ， 这 种 方式 也 同样 适用 于 内 置 类 型 。 对 
于 std::atomic<T> 模板 ， 使 用 对 应 的 T 类 型 去 特 化 模板 的 方式 ， 要 好 于 使 用 别名 的 方式 。 


通常 ， 标 准 原 子 类 型 是 不 能 拷贝 和 赋值 ， 他 们 没有 拷贝 构造 函数 和 拷贝 赋值 操作 。 但 是 ， 
为 可 以 隐 式 转化 成 对 应 的 内 置 类 型 ， 所 以 这 些 类 型 依旧 支持 赋值 ， 可 以 使 用 load() 和 store() 成 
it 函数 ，exchange()、compare_exchange_weak() 和 compare_exchange_strong()。 它 们 都 
支持 复合 赋值 符 : +=, -=, *=, |= 等 等 。 并 且 使 用 整 型 和 指针 的 特 化 类 型 还 支持 ++ 和 --。 当 
然 ， 这 些 操 作 也 有 功能 相同 的 成 员 函 数 所 对 应 : fetch_add(), fetch_or() 等 等 。 赋 值 操 作 和 成 


员 部 数 的 返回 值 要 么 是 被 存储 的 值 (赋值 操作 )， 要 么 是 操作 前 的 值 (命名 函数 )。 这 就 能 避免 赋 
值 棕 作 符 返回 引用 。 为 了 获取 存储 在 引用 的 的 信 ， 代 码 需 要 执行 半 痢 的 读 操 作 ， 从 而 入 许 另 
一 个 线程 在 赋值 和 读 取 进行 的 同时 修改 这 个 值 ， 这 也 就 为 条 件 竞争 打开 了 大 门 。 


std::atomic<> 类 模板 不 仅仅 一 套 特 化 的 类 型 ， 其 作为 一 个 原 发 模板 也 可 以 使 用 用 户 定义 类 型 
创建 对 应 的 原子 变量 。 因 为 ， 它 是 一 个 通用 类 模板 ， 操 作 被 限制 为 load(),store()( 赋 值 和 转换 
为 用 户 类 型 ), exchange(), compare_exchange_weak()4*compare_exchange_strong() ° 


每 种 函数 类 型 的 操作 都 有 一 个 Puan a ， 这 个 参数 可 以 用 来 指定 所 需 存储 的 顺序 。 
在 5.3 节 中 ， 会 对 存储 顺序 选项 进行 详 述 。 现 在 ， 只 需要 知道 操作 分 为 三 类 


1. Store 操 作 ， 可 选 如 下 顺序 : memory_order_relaxed, memory_order_release, 
memory_order seq cst° 

2. Load 操 作 ， 可 选 如 下 顺序 : memory_order_relaxed, memory_order_consume, 
memory_order_acquire, memory_order_seq_cst ° 

3，Read-modify-write( 读 - 改 - 写 ) 操 作 ， 可 选 如 下 顺序 : memory_order_relaxed, 
memory_order_consume, memory_order_acquire, memory_order_release, 
memory_order_acq_rel, memory_order_seq_cst ° 
所 有 操作 的 默认 顺序 都 是 memory_order seq_cst。 


现在 ， 让 我 们 来 看 一 下 每 个 标准 原子 类 型 进行 的 操作 ， 就 从 std: :atomic_flag 开始 吧 “。 


5.2.2 std::atomic_flag 的 相关 操作 


std::atomic_flag 是 最 简单 的 标准 原子 类 型 ， 它 表示 了 一 个 布尔 标志 。 这 个 类 型 的 对 象 可 以 
在 两 个 状态 间 切 换 : 设置 和 清除 。 它 就 是 那么 的 简单 ， 只 作为 一 个 构建 块 存在 。 我 从 未 期 待 
这 个 类 型 被 使 用 ， 除 非 在 十 分 特别 的 情况 下 。 正 因 如 此 ， 它 将 作为 讨论 其 他 原子 类 型 的 起 

点 ， 因 为 它 会 展示 一 些 原子 类 型 使 用 的 通用 策略 。 


std: :atomic_flag 类 型 的 对 象 必须 被 ATOMIC_FLAG_INIT 初 始 化 。 初 始 化 标志 位 是 “清除 ” 状 
态 。 这 里 没 得 选择 ; 这 个 标志 总 是 初始 化 为 “清除 ”: 


std::atomic flag f = ATOMIC_FLAG_INIT; 


这 适用 于 任何 对 象 的 声明 ， 并 且 可 在 任意 范围 内 。 它 是 唯一 需要 以 如 此 特殊 的 方式 初始 化 的 
原子 类 型 ， 但 它 也 是 唯一 保证 无 锁 的 类 型 。 如 果 std::atomic flag 是 静态 存储 的 ， 那 么 就 的 
保证 其 是 静态 初始 化 的 ， 也 就 意味 着 没有 初始 化 顺序 问题 ; 在 首次 使 用 时 ， 其 都 需要 初始 
化 。 


当 你 的 标志 对 象 已 初始 化 ， 那 么 你 只 能 做 三 件 事情 : 销毁 ， 清 除 或 设置 (查询 之 前 的 值 ) 。 这 些 
事情 对 应 的 函数 分 别 是 : clear() 成 员 函 数 ， 和 test_and _set() 成 员 函 数 。clear() 和 
test_and _set() 成 员 函 数 可 以 指定 好 内 存 顺 序 。clear() 是 一 个 存储 操作 ， 所 以 不 能 


memory_order_acquire 或 memory_order_acq_rel 语 义 ， 但 是 test_and_set() 是 一 个 “ 读 - 改 - 
写 " 操 作 ， 所 有 可 以 应 用 于 任何 内 存 顺 序 标签 。 每 一 个 原子 操作 ， 上 默认 的 内 存 顺 序 都 是 
memory_order_seq_cst°。 例 如 : 


f.clear(std::memory_order_release); // 1 
bool x=f.test_and_set(); // 2 


这 里 ， 调 用 clear()@ 明 确 要 求 ， 使 用 释放 语义 清除 标志 ， 当 调用 test_and_set()@ 使 用 默认 内 
存 顺 序 设置 表示 ， 并 且 检 索 旧 值 。 


你 不 能 拷贝 构造 另 一 个 std::atomic_flag 对 象 ;并且 ， 你 不 能 将 一 个 对 象 赋予 另 一 

^Ù std: :atomic_flag 对 象 © 这 并 不 是 std::atomic flag 特有 的 > 而 是 所 有 原子 类 型 共有 的 
一 个 原子 类 型 的 所 有 操作 都 是 原子 的 ， 因 赋值 和 拷贝 调用 了 两 个 对 象 ， 这 就 就 破坏 了 操作 的 
原子 性 。 在 这 样 的 情况 下 ， 拷 贝 构造 和 拷贝 赋值 都 会 将 第 一 个 对 象 的 值 进行 读 取 ， 然 后 再 写 
入 另外 一 个 。 对 于 两 个 独立 的 对 象 ， 这 里 就 有 两 个 独立 的 操作 了 ， 合 并 这 两 个 操作 必定 是 不 
原子 的 。 因 此 ， 操 作 就 不 被 允许 。 


有 限 的 特性 集 使 得 std::atomic_flag 非常 i 适合 合 于 作 自 we AFF il o FIRE AGAR A EG zA 青 除 ”， HAA 
斥 量 处 于 解锁 状态 。 为 了 锁 上 互 斥 量 ， 循 环 运行 test _ and _set() 直 到 上 昌 值 为 false， 就 意味 着 这 
个 线程 已 经 被 设置 为 true 了 。 解 锁 互 斥 量 是 一 件 很 简单 的 事情 ， 将 标志 清除 即 可 。 实 现 如 下 面 
的 程序 清单 所 示 : 


清单 5.1 使 用 std::atomic_flag KIL A He ZI 4 


class spinlock_mutex 
{ 
std::atomic_flag flag; 
public: 
spinlock_mutex(): 
flag(ATOMIC_FLAG_INIT) 
{} 
void lock() 
{ 
while(flag.test_and_set(std: :memory_order_acquire) ); 
} 


void unlock() 


i 


flag.clear(std::memory_order_release) ; 


}; 


这 样 的 互 矿 量 是 最 最 基本 的 ， 但 是 它 已 经 足够 std::lock_guard<> 使 用 了 ( 详 见 第 3 章 )。 其 本 质 
就 是 在 lock() 中 等 待 ， 所 以 这 里 几乎 不 可 能 有 竞争 的 存在 ， 并 且 可 以 确保 互 斥 。 当 我 们 看 到 内 
存 顺 序 语义 时 ， 你 将 会 看 到 它们 是 如 何 对 一 个 互 斥 锁 保 证 必要 的 强制 顺序 的 。 这 个 例子 将 在 

5.3.6 节 中 展示 。 


由 于 std: :atomic_flag 局 限 性 太 强 ， 因 为 它 没 有 非 修改 查询 操作 2 它 甚至 不 能 像 普通 的 布尔 
标志 那样 使 用 。 所 以 ， 你 最 好 使 用 std::atomic<boo1> ， 接 下 来 让 我 们 看 看 应 该 如 何 使 用 它 。 


5.2.3 std::atomic 的 相关 操作 


最 基本 的 原子 整 型 类 型 就 是 std::atomic<bool> 。 如 你 所 料 2 它 有 着 比 std: :atomic_flag 更 加 
齐全 的 布尔 标志 特性 。 虽 然 它 依旧 不 能 拷贝 构造 和 拷贝 赋值 ， 但 是 你 可 以 使 用 一 个 非 原子 的 
bool 类 型 构造 它 ， 所 以 它 可 以 被 初始 化 为 true 或 false， 并 且 你 也 可 以 从 一 个 非 原子 pool 变量 赋 


值 给 std::atomic<bool> 的 实例 : 


std::atomic<bool> b(true); 
b=false; 


另 一 件 需要 注意 的 事情 时 ， 非 原子 bool 类 型 的 赋值 操作 不 同 于 通常 的 操作 (转换 成 对 应 类 型 的 
引用 ， 再 赋 给 对 应 的 对 象 ) : 它 返 回 一 个 bool 值 来 代替 指定 对 象 。 这 是 在 原子 类 型 中 ， 另 一 种 
常见 的 模式 : 赋值 操作 通过 返回 值 (返回 相关 的 非 原子 类 型 ) 完 成 ， 而 非 返 回 引 用 。 如 果 一 个 原 
子 变量 的 引用 被 返回 了 ， 任 何 依赖 与 这 个 赋值 结果 的 代码 都 需要 显 式 加 载 这 个 值 ， 潜 在 的 问 
题 是 ， 结 果 可 能 会 被 另外 的 线程 所 修改 。 通 过 使 用 返回 非 原子 值 进行 赋值 的 方式 ， 你 可 以 避 
免 这 些 多 余 的 加 载 过 程 ， 并 且 得 到 的 值 就 是 实际 存储 的 值 。 


虽然 有 内 存 顺 序 语义 指定 ， 但 是 使 用 store() 去 写 入 (true 或 false) 还 是 好 于 std::atomic_flag 中 
限制 性 很 强 的 clear()。 同 样 的 ，test_and_set() 函 数 也 可 以 被 更 加 通用 的 exchange() 成 员 芳 数 
所 替换 ，exchange() 成 员 函 数 允 许 你 使 用 你 新 选 的 值 蔡 换 已 存储 的 值 ， 并 且 自 动 的 检索 原始 
值 。 std::atomic<bool> 也 支持 对 值 的 普通 (不 可 修改 ) 查 找 ， 其 会 将 对 象 隐 式 的 转换 为 一 个 普 
通 的 bool 值 ， 或 显示 的 调用 load() 来 完成 。 如 你 预期 ，store() 是 一 个 存储 操作 ， 而 load() 是 一 个 
加 载 操 作 。exchange() 是 一 个 “ 读 - 改 - 写 操作 : 


std::atomic<bool> b; 

bool x=b.load(std: :memory_order_acquire); 
b.store(true); 

x=b.exchange(false, std: :memory_order_acq_rel); 


std: :atomic<bool> 提供 的 exchange()， 不 仅仅 是 一 个 “ 读 - 改 - 写 ? 的 操作 ; 它 还 介绍 了 一 种 新 的 
存储 方式 : 当当 前 值 与 预期 值 一 致 时 ， 存 储 新 值 的 操作 。 


存储 一 个 新 值 (或 昌 值 ) 取 决 于 当前 什 


这 是 一 种 新 型 操作 ， 叫 做 “比较 /交换 ”"， 它 的 形式 表现 为 compare_exchange_weak() 和 
compare_exchange_strong() 成 员 元 数 。“ 比 较 / 交 换 " 操 作 是 原子 类 型 编程 的 基石 ; 它 比较 原子 
变量 的 当前 值 和 一 个 期 望 值 ， 当 两 值 相 等 时 ， 存 储 提供 值 。 当 两 值 不 等 ， 期 望 值 就 会 被 更 新 
为 原子 变量 中 的 值 。“ 比 较 /交换 ?函数 值 是 一 个 bool 变 量 ， 当 返回 true 时 执行 存储 操作 ， 当 false 
则 更 新 期 望 值 。 


对 于 compare_exchange_weak() 部 数 ， 当 原始 值 与 预期 值 一 致 时 ， 存 储 也 可 能 会 不 成 功 ; 在 
这 个 例子 中 变量 的 值 不 会 发 生 改 变 ， 并 且 compare_exchange_weak() 的 返回 是 false。 这 可 能 
发 生 在 缺少 独立 “比较 -交换 "指令 的 机 器 上 ， 当 处 理 器 不 能 保证 这 个 操作 能 够 自动 的 完成 一 一 
可 能 是 因为 线程 的 操作 将 指令 队列 从 中 间 关 闭 ， 并 且 另 一 个 线程 安排 的 指令 将 会 被 操作 系统 
所 替换 (这 里 线程 数 多 于 处 理 器 数量 )。 这 被 称 为 “ 伪 失 败 "(Spurious failure)， 因 为 造成 这 种 情况 
的 原因 是 时 间 ， 而 不 是 变量 值 。 


为 compare exchange _weak() 可 以 “ 伪 失 败 ”， 所 以 这 里 通常 使 用 一 个 循环 : 


bool expected=false; 
extern atomic<bool> b; // 设置 些 什么 
while(!b.compare_exchange_weak(expected, true) && !expected); 


在 这 个 例子 中 ， 循 环 中 expected 的 值 始 终 是 false， 表 示 compare_exchange_weak() 会 英名 的 
失败 。 


另 一 方面 ， 如 果实 际 值 与 期 望 值 不 符 ，compare_exchange _strong() 就 能 保证 值 返回 false。 这 
就 能 消除 对 循环 的 需要 ， 就 可 以 知道 是 否 成 功 的 改变 了 一 个 变量 ， 或 已 让 另 一 个 线程 完成 。 


如 果 你 想 要 改变 变量 值 ， 且 无 论 初始 值 是 什么 (可 能 是 根据 当前 值 更 新 了 的 值 )， 更 新 后 的 期 户 
值 将 会 变更 有 用 ; 经 历 每 次 循环 的 时 候 ， 期 望 值 都 会 重新 加 载 ， 所 以 当 没 有 其 他 线程 同时 修 
改期 望 时 ， 和 人 循环 中 对 compare_exchange_weak() 或 compare_exchange _strong() 的 调用 都 会 
在 下 一 次 (第 三 次) 成功。 如 果 值 的 计算 很 容易 存储 ， 那 么 使 用 compare_exchange_weak() 能 
更 好 的 避免 一 个 双重 循环 的 执行 ， 即 使 compare_exchange_weak() 可 能 会 “ 伪 失 败 "( 因 此 
compare_exchange_strong() 包 含 一 个 循环 )。 另 一 方面 ， 如 果 值 计算 的 存储 本 身 是 耗 时 的 ， 
那么 当期 望 值 不 变 时 ， 使 用 compare_exchange_strong() 可 以 避免 对 值 的 重复 计算 。 对 

于 std::atomic<bool> 这 些 都 不 重要 一 一 毕 竞 只 可 能 有 两 种 值 一 一 但 是 对 于 其 他 的 原子 类 型 就 
有 较 大 的 影响 了 。 


“比较 /交换 "函数 很 少 对 两 个 拥有 内 存 顺序 的 参数 进行 操作 ， 这 就 就 允许 内 存 顺序 语义 在 成 功 
和 失败 的 例子 中 有 所 不 同 ; 其 可 能 是 对 emory_order_acq_rel 语 义 的 一 次 成 功 调用 ， 而 对 
memory_order_relaxed 语 义 的 一 次 失败 的 调动 。 一 次 失败 的 “比较 /交换 "将 不 会 进行 存储 ， 所 
以 “比较 /交换 ”操作 不 能 拥有 memeory_order_release 或 memory_order acq_rel 语 义 。 因 此 ， 


这 里 不 保证 提供 的 这 些 值 能 作为 失败 的 顺序 。 你 也 不 能 提供 比 成 功 顺 序 更 加 严格 的 失败 内 存 
顺序 ; 当 你 需要 memory_order_acquire 或 memory_order_seq_cst 作 为 失败 语序 ， 那 必须 要 如 
同 “ 指 定 它们 是 成 功 语 序 " 那 样 去 做 。 


如 果 你 没有 指定 失败 的 语序 ， 那 就 假设 和 成 功 的 顺序 是 一 样 的 ， 除 了 release 部 分 的 顺序 : 
memory_order _release 变 成 nemory_order_relaxed， 并 且 memoyr_order_acq_rel 变 成 
memory_order_acquire。 如 果 你 都 不 指定 ， 他 们 默认 顺序 将 为 memory_order seq_cst， 这 个 
顺序 提供 了 对 成 功 和 失败 的 全 排序 。 下 面 对 compare_exchange_weak() 的 两 次 调用 是 等 价 
ay: 


std::atomic<bool> b; 

bool expected; 

b.compare_exchange_weak(expected, true, 
memory_order_acq_rel,memory_order_acquire); 

b.compare_exchange_weak(expected, true, memory_order_acq_rel); 


我 在 5.3 节 中 会 详解 对 于 不 同 内 存 顺序 选择 的 结果 。 


std::atomic<bool> 和 std: :atomic_flag 的 不 同 之 处 在 于 > std::atomic<bool> 不 是 无 锁 的 ; 
为 了 保证 操作 的 原子 性 ， 其 实现 中 需要 一 个 内 置 的 互 斥 量 。 当 处 于 特殊 情况 时 ， 你 可 以 使 用 
is_lock free() 成 员 函 数 ， 去 检查 std::atomic<bool> 上 的 操作 是 否 无 锁 。 这 是 另 一 个 ， 除 

f std: :atomic_flag 之 外 2 所 有 原子 类 型 都 拥有 的 特征 





第 二 简 单 的 原子 类 型 就 是 特 化 原 子 指 针 std::atomic<T*> ? 接 下 来 就 看 看 它 是 如 何 工作 的 


we, o 
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原子 指针 类 型 ， 可 以 使 用 内 置 类 型 或 自 定义 类 型 T， 通 过 特 化 std::atomic<T*> 进行 定义 ， 就 
如 同 使 用 bool 类 型 定义 std: :atomic<bool> 类 型 一 样 虽然 接口 几乎 一 致 2 但 是 它 的 操作 是 对 
于 相关 的 类 型 的 指针 ， 而 非 bool 值 本 身 。 就 像 std::atomic<bool> ， 虽 然 它 既 不 能 拷贝 构造 ， 
也 不 能 拷贝 赋值 ， 但 是 他 可 以 通过 合适 的 类 型 指针 进行 构造 和 赋值 。 如 同 成 员 郊 数 

is_lock free() 一 样 ， std::atomic<T*> 也 有 load(), store(), exchange(), 
compare_exchange_weak()#*compare_exchage_strong() 7% it ak > 

与 std::atomic<bool> 的 语义 相同 ， 获 取 与 返回 的 类 型 都 是 T*， 而 不 是 bool。 


std::atomic<T*> 为 指针 运算 提供 新 的 操作 。 基 本 操作 有 fetch_add() 和 fetch_sub() 提 供 ， 它 们 
在 存储 地 址 上 做 原子 加 法 和 减法 ， 为 +=, -=, ++ 和 -- 提 供 简 易 的 封装 。 对 于 内 置 类 型 的 操作 ， 
如 你 所 预期 : 如 果 X 是 std: :atomic<Foo*> 类 型 的 数组 的 首 地 址 ， 然 后 x+=3 让 其 偏 移 到 第 四 个 
元 素 的 地 址 ， 并 且 返 回 一 个 普通 的 Foo* 类 型 值 ， 这 个 指针 值 是 指向 数组 中 第 四 个 元 素 。 
fetch_add() 和 fetch_sub() 的 返回 值 咯 有 不 同 ( 所 以 x.ftech_add(3) 让 x 指向 第 四 个 元 素 ， 并 且 允 


数 返回 指向 第 一 个 元 素 的 地 址 )。 这 种 操作 也 被 称 为 “交换 - 相 加 "， 并 且 这 是 一 个 原子 的 “ 读 - 改 - 
写 " 操 作 ， 如 同 exchange() 和 compare_exchange_weak()/compare_exchange_strong() 一 样 。 
正 像 其 他 操作 那样 返回 值 是 一 个 普通 的 T* 值 ， 而 非 是 std: :atomic<T*> 对 象 的 引 用 ， 所 以 
调用 代码 可 以 基于 之 前 的 值 进行 操作 : 


class Foo{}; 

Foo some_array[5]; 

std: :atomic<Foo*> p(some_array); 

Foo* x=p.fetch_add(2); // p 加 2， 并 返回 原始 值 
assert(x==some_array); 
assert(p.load()==&some_array[2]); 

X=(p-=1); // p 减 1， 并 返回 原始 值 
assert(x==&some_array[1]); 
assert(p.load()==&some_array[1]); 


函数 也 允许 内 存 顺序 语义 作为 给 定 函数 的 参数 : 


p.fetch_add(3,std::memory_order_release) ; 


因为 fetch_add() 和 fetch_sub() 都 是 * 读 - 改 - 写 操作， 它们 可 以 拥有 任意 的 内 存 顺序 标签 ， 以 及 
加 入 到 一 个 释放 序列 中 。 指 定 的 语序 不 可 能 是 操作 符 的 形式 ， 因 为 没 办 法 提供 必要 的 信息 : 
这 些 形式 都 具有 memory_order seq_cst 语 义 。 


剩 下 的 原子 类 型 基本 上 都 差不多 : 它们 都 是 整 型 原子 类 型 ， 并 且 都 拥有 同样 的 接口 (除了 相关 
的 内 置 类 型 不 一 样 )。 下 面 我 们 就 看 看 这 一 类 类 型 。 


5.2.5 标准 的 原子 整 型 的 相关 操作 


如 同 普通 的 操作 集合 一 样 (load(), store(), exchange(), compare_exchange_weak(), 和 
compare_exchange_strong()) > 在 std::atomic<int> 和 std: :atomic<unsigned long long> 也 
是 有 一 套 完 整 的 操作 可 以 供 使 用 : fetch_add(), fetch_sub(), fetch_and(), fetch_or(), 
fetch_xor()， 还 有 复合 赋值 方式 ((+=, -=, &=, |= 和 ^=)， 以 及 ++ 和 --(++X, X++, --X 和 X--)。 虽 然 
对 于 普通 的 整 型 来 说 ， 这 些 复 合 赋值 方式 还 不 完全 ， 但 也 十 分 接近 完整 了 : 只 有 除法 、 乘 法 
和 移 位 操作 不 在 其 中 。 因 为 ， 整 型 原子 值 通常 用 来 作 计 数 器 ， 或 者 是 掩 码 ， 所 以 以 上 操作 的 
缺失 显得 不 是 那么 重要 ; 如 果 需 要 ， 额 外 的 操作 可 以 将 compare_exchange_weak() 放 入 循环 
中 完成 。 

对 于 std::atomic<T*> 类 型 紧密 相关 的 两 个 函数 就 是 fetch_add() 和 fetch_sub() ; 函数 原子 化 操 
作 ， 并 且 返 回 日 值 ， 而 符合 赋值 运算 会 返回 新 值 。 前 组 加 减 和 后 组 加 减 与 普通 用 法 一 样 : ++X 
对 变量 进行 自如， 并 且 返 回 新 值 ; 而 X++ 对 变量 自如， 返回 上 昌 值 。 正 如 你 预期 的 那样 ， 在 这 两 


个 例子 中 ， 结 果 都 是 相关 整 型 的 一 个 值 。 


我 们 已 经 看 过 所 有 基本 原子 类 型 ; 剩 下 的 就 是 std::atomic<> 类 型 模板 ， 而 非 其 特 化 类 型 。 那 
么 接 下 来 让 我 们 来 了 解 一 下 std::atomic<> 类 型 模板 。 


5.2.6 std::atomic<> 主 要 类 的 模板 


主 模板 的 存在 ， 在 除了 标准 原子 类 型 之 外 ， 允 许 用 户 使 用 自 定义 类 型 创建 一 个 原子 变量 。 不 
是 任何 自 定义 类 型 都 可 以 使 用 std::atomic<> 的 : 需要 满足 一 定 的 标准 才 行 。 为 了 使 

用 std::atomic<UDT> (UDT 是 用 户 定 义 类 型 )， 这 个 类 型 必须 有 拷贝 赋值 运算 符 。 这 就 意味 着 这 
个 类 型 不 能 有 任何 虚 函 数 或 庶 基 类 ， 以 及 必须 使 用 编译 器 创建 的 找 贝 赋值 操作 。 不 仅仅 是 这 
些 ， 自 定义 类 型 中 所 有 的 基 类 和 非 静 态 数据 成 员 也 都 需要 支持 拷贝 赋值 操作 。 这 (基本 上 ) 就 允 
许 编译 器 使 用 memcpy() ， 或 赋值 操作 的 等 价 操作 ， 因 为 它们 的 实现 中 没有 用 户 代码 。 


最 后 ， 这 个 类 型 必须 是 “位 可 比 的 "(bitwise equality comparable)。 这 与 对 赋值 的 要 求 差不多 ; 
你 不 仅 需 要 确定 ， 一 个 UDT 类 型 对 象 可 以 使 用 memcpy() 进 行 拷贝 ， 还 要 确定 其 对 象 可 以 使 用 
memcmp() 对 位 进行 比较 。 之 所 以 要 求 这 么 多 ， 是 为 了 保证 “比较 /交换 "操作 能 正常 的 工作 。 


以 上 严格 的 限制 都 是 依据 第 3 章 中 的 一 个 建议 : 不 要 将 锁定 区 域内 的 数据 ， 以 引用 或 指针 的 形 
式 ? 作为 参数 传递 给 用 户 提 供 的 A o 通常 情况 下 编译 器 不 会 为 std::atomic<UDT> 类 型 生 
成 无 锁 代码 ， 所 以 它 将 对 所 有 操作 使 用 一 个 内 部 锁 。 如 果 用 户 提供 的 拷贝 赋值 或 比较 操作 被 
允许 ， 那 么 这 就 需要 传递 保护 数据 的 引用 作为 一 个 参数 ， 这 就 有 悖 于 指导 意见 了 。 当 原子 操 
作 需 要 时 ， 运 行 库 也 可 自由 的 使 用 单 锁 ， 并 且 运 行 库 允 许 用 户 提供 函数 持 有 锁 ， 这 样 就 有 可 
能 产生 死 锁 (或 因为 做 一 个 比较 操作 ， 而 阻塞 了 其 他 的 线程 )。 最 终 ， 因 为 这 些 限制 可 以 让 编译 
器 将 用 户 定义 的 类 型 看 作为 一 组 原始 字 节 ， 所 以 编译 器 可 以 对 std::atomic<UDT> 直接 使 用 原 
子 指令 (因此 实例 化 一 个 特殊 无 锁 结 构 )。 


注意 > 虽然 使 用 std::atomic<float> 或 std::atomic<double> (内 置 浮 点 类 型 满足 使 用 
memcpy 和 memcmp 的 标准 ) ， 但 是 它们 在 compare_exchange_strong 函 数 中 的 表现 可 能 会 
令 人 惊讶 。 当 存储 的 值 与 当前 值 相 等 时 ， 这 个 操作 也 可 能 失败 ， 可 能 因为 昌 值 是 一 个 不 同方 
式 的 表达 。 这 就 不 是 对 浮 点 数 的 原子 计算 操作 了 。 在 使 用 compare_exchange _strong 函 数 的 
过 程 中 ， 你 可 能 会 遇 到 相同 的 结果 ， 如 果 你 使 用 std::atomic<> 特 化 一 个 用 户 自 定义 类 型 ， 且 
这 个 类 型 定义 了 比较 操作 ， 而 这 个 比较 操作 与 nemcmp 又 有 不 同 操作 可 能 会 失败 ， 因 为 
两 个 相等 的 值 拥有 不 同 的 表达 方式 。 





如 果 你 的 UDT 类 型 的 大 小 如 同 (或 小 于 ) 一 个 int 或 voiq* 类 型 时 ， 大 多 数 平台 将 会 

对 std::atomic<uDT> 使 用 原子 指令 。 有 些 平台 可 能 会 对 用 户 自 定义 类 型 (两 倍 于 int 或 void* 的 
大 小 ) 特 化 的 std::atmic<> 使 用 原子 指令 。 这 些 平台 通常 支持 所 谓 的 “ 双 字 节 比 较 和 交 

换 ”(double-word-compare-and-swap，DWCAS) 指 令 ， 这 个 指令 与 compare_exchange_xxx 
相关 联 着 。 这 种 指令 的 支持 ， 对 于 写 无 锁 代 码 是 有 很 大 的 帮助 ， 具 体 的 内 容 会 在 第 7 章 讨论 。 


5.2 C++ 中 的 原子 操作 和 原子 类 型 


以 上 的 限制 也 意味 着 有 些 事情 你 不 能 做 ， 比 如 ， 创 建 一 个 stdi:atomic<std: :vector<int>> 类 
型 。 这 里 不 能 使 用 包含 有 计数 器 ， 标 志 指 针 和 简单 数组 的 类 型 ， 作 为 特 化 类 型 。 虽 然 这 不 会 
导致 任何 问题 ， 但 是 ， 越 是 复杂 的 数据 结构 ， 就 有 越 多 的 操作 要 去 做 ， 而 非 只 有 赋值 和 比 
较 。 如 果 这 种 情况 发 生 了 ， 你 最 好 使 用 std: :mutex 保证 数据 能 被 必要 的 操作 所 保护 ， 就 像 第 
3 章 描 述 的 。 


当 使 用 用 户 定义 类 型 T 进 行 实例 化 时 ， std::atomic<T> 的 可 用 接口 就 只 有 :load(), store(), 
exchange(), compare_exchange_weak(), compare_exchange_strong() 和 赋值 操作 ， 以 及 向 
类 型 T 转 换 的 操作 。 表 5.3 列 举 了 每 一 个 原子 类 型 所 能 使 用 的 操作 。 





test_and_set 

clear v 

is_lock free y v v V 
load v v v y 
store V v v Vv 
exchange v v y v 
compare exchange weak, y v Vv W 
compare exchange strong 

fetch_add, += v 

fetch sub, -= v v 

fetch or, |= v 

fetch and, &= v 

fetch_xor, “= Vv 

++; -- v v 




















R5.3 每 一 个 原子 类 型 所 能 使 用 的 操作 


5.2.7 原子 操作 的 释放 函数 


直到 现在 ， 我 都 还 没有 去 描述 成 员 函 数 对 原子 类 型 操作 的 形式 。 但 是 ， 在 不 同 的 原 中 
也 有 等 价 的 非 成 员 函 数 存在 。 大 多 数 非 成 员 函 数 的 命名 与 对 应 成 员 函 数 有 关 ， 但 是 
要 “atomic “作为 前 组 (比如 ， std: :atomic_load() )°。 这些 函 数 都 会 被 不 ae eee o 
在 指定 一 个 内 存 序列 标签 时 ， 他 们 会 分 成 两 种 : 一 种 没有 标签 ， 另 一 种 将 ” explicit 作 为 后 
组， 并且 需要 一 个 额外 的 参数 ， 或 将 内 存 顺 序 作为 标签 ， 亦 或 只 有 标签 ( 例 
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to > std: :atomic_store(&atomic_var,new_value) std: :atomic_store_explicit(&atomic_var,ne 
w_value, std: :memory order_release ) ° RH > REM RAM A BAAS] > MAHER Ra 
持 有 一 个 指向 原子 对 象 的 指针 (作为 第 一 个 参数 )。 


例如 ， std: :atomic_is_lock_free() 只 有 一 种 类 型 (虽然 会 被 其 他 类 型 所 重 载 ) 并 且 对 于 同一 
个 对 象 a， std::atomic_is_lock_free(&a) 返回 值 与 a.is_lock free() 相 同 。 同 样 

的 ， std: :atomic_load(&a) 和 a.load() 的 作用 一 样 ， 但 需要 注意 的 是 ， 与 
a.load(std::memory_order_acquire) 等 价 的 操作 是 std: :atomic_load_explicit(&a, 


std::memory_order_acquire) ° 


释放 函数 的 设计 是 为 了 要 与 C 语 言 兼 容 ， 在 C 中 只 能 使 用 指针 ， 而 不 能 使 用 引用 。 例 如 ， 
compare_exchange_weak() 和 compare_exchange _strong() 成 员 函 数 的 第 一 个 参数 (期 望 值 ) 是 
一 个 引用 ， 而 std: :atomic_compare_exchange_weak() (第 一 个 参数 是 指向 对 象 的 指针 ) 的 第 二 个 
参数 是 一 个 指针 。 std: :atomic_compare_exchange_weak_explicit() 也 需要 指 定 成 功 和 失败 的 内 
存 序 列 ， 而 “比较 /交换 "成 员 有 函数 都 有 一 个 单 内 存 序列 形式 (默认 

是 std: :memory_order_seq_cst )， 重 载 函 数 可 以 分 别 获取 成 功 和 失败 内 存 序列 。 

对 std::atomic flag 的 操作 是 “ 反 潮 流 " 的 ， 在 那些 操作 中 它们 “标志 ”的 名 称 

为 : std::atomic_flag_test_and_set() 和 std::atomic_flag_clear() ， 但 是 以 ” explicit 为 后 组 
的 额外 操作 也 能 够 指定 内 存 顺 


JP | std::atomic flag_test_and_set_explicit() 和 std: :atomic_flag_clear_explicit() ° 








C++ 标准 库 也 对 在 一 个 原子 类 型 中 的 std::shared_ptr<> 智能 指针 类 型 提供 释放 函数 。 这 打破 
了 “只 有 原子 类 型 ， 才 能 提供 原子 操作 ”的 原则 ， 这 里 std::shared_ptr<> 肯定 不 是 原子 类 型 。 
但 是 ，C++ 标 准 委员 会 感觉 对 此 提供 额外 的 函数 是 很 重要 的 。 可 使 用 的 原子 操作 有 : load, 
store, exchange 和 compare/exchange， 这 些 操作 重 载 了 标准 原子 类 型 的 操作 ， 并 且 获 取 一 
个 std::shared_ptr<>* 作为 第 一 个 参数 : 


std::shared_ptr<my_data> p; 

void process_global_data() 

{ 
std::shared_ptr<my_data> local=std::atomic_load(&p); 
process_data(local); 

} 

void update_global_data() 

{ 
std::shared_ptr<my_data> local(new my_data); 
std::atomic_store(&p, local); 


作为 和 原子 操作 一 同 使 用 的 其 他 类 型 ， 也 提供 * explicit" 变 量 ， 人 允许 你 指定 所 需 的 内 存 顺 序 ， 
并 且 std::atomic_is_lock_free() 函数 可 以 用 来 确定 实现 是 否 使 用 锁 ， 来 保证 原子 性 。 


如 之 前 的 描述 ， 标 准 原子 类 型 不 仅仅 是 为 了 避免 数据 竞争 所 造成 的 未 定义 操作 ， 它 们 还 允许 
用 户 对 不 同 线程 上 的 操作 进行 强制 排序 。 这 种 强制 排序 是 数据 保护 和 同步 操作 的 基础 ， 例 
如 ， std::mutex 和 std::future<> 。 所 以 ， 让 我 继续 了 解 本 章 的 中 实意 义 : 内 存 模 型 在 并 发 
方面 的 细节 ， 如 何 使 用 原子 操作 同步 数据 和 强制 排序 。 


5.3 同步 操作 和 强制 排序 


假设 你 有 两 个 线程 ， 一 个 向 数据 结构 中 填充 数据 ， 另 一 个 读 取 数 据 结构 中 的 数据 。 为 了 避免 
恶性 条 件 竞争 ， 第 一 个 线程 设置 一 个 标志 ， 用 来 表明 数据 已 经 准备 就 绪 ， 并 且 第 二 个 线程 在 
这 个 标志 设置 前 不 能 读 取 数 据 。 下 面 的 程序 清单 就 是 这 样 的 情况 。 


清单 5.2 不 同 线程 对 数据 的 读 写 
#include <vector> 
#include <atomic> 


#include <iostream> 


std::vector<int> data; 
std::atomic<bool> data_ready(false); 


void reader_thread() 


{ 
while(!data_ready.load()) // 1 
{ 
std::this_thread::sleep(std::milliseconds(1)); 
} 
std::cout<<"The answer="<<data[0]<<"\m"; // 2 
} 
void writer_thread() 
{ 
data.push_back(42); // 3 
data_ready=true; // 4 
} 


先 把 等 待 数据 的 低 效 循环 @ 放 在 一 边 (你 需要 这 个 循环 ， 否 则 想 要 在 线程 问 共享 数据 就 是 不 切 
实际 的 : 数据 的 每 一 项 都 必须 是 原子 的 ) 。 你 已 经 知道 ， 当 非 原子 读 @ 和 号 国 对 同一 数据 结构 
进行 无 序 访问 时 ， 将 会 导致 未 定义 行为 的 发 生 ， 因 此 这 个 循环 就 是 确保 访问 循序 被 严格 的 遵 
守 的 。 


强制 访问 顺序 是 由 对 std::atomic<bool> 类 型 的 data_ready 变 量 进行 操作 完成 的 ; 这 些 操作 通 
过 先行 发 生 (happens-before) 和 同步 发 生 (Ssynchronizes-with) 确 定 必 要 的 顺序 。 写 入 数据 加 的 
操作 ， 在 写 入 data_ready 标 志 图 的 操作 前 发 生 ， 并 且 读 取 标 志 @@ 发 生 在 读 取 数 据 @ 之 前 。 当 
data_ready@ 为 true， 写 操作 就 会 与 读 操作 同步 ， 建 立 一 个 “先行 发 生 "关系 。 因 为 "先行 发 

生 " 是 可 传递 的 ， 所 以 写 入 数据 回 先行 于 写 入 标志 图， 这 两 个 行为 又 先行 于 读 取 标 志 的 操作 


四 ， 之 前 的 操作 都 先行 于 读 取 数据 @， 这 样 你 就 拥有 了 强制 顺序 : 写 入 数据 先行 于 读 取 数据 ， 
其 他 没 问题 了 。 图 5.2 展 示 了 先行 发 生 在 两 线程 间 的 重要 性 。 我 向 读者 线程 的 while 循 环 中 添加 
了 一 对 迭代 。 


data_ready.load() 
(returns false) 


data.push_back (42) 


data ready.load() 


data ready=true 
和 can (returns false) 


data ready.load() 
(returns true) 


data[0] 
(returns 42) 





Writer thread Reader thread 


图 5.2 对 非 原 子 操作 ， 使 用 原子 操作 对 操作 进行 强制 排序 

所 有 事情 看 起 来 非常 直观 : 对 一 个 值 来 说 ， 写 操作 必然 先 于 读 操 作 ! 在 默认 它们 都 是 原子 操 
作 的 时 候 ， 这 无 疑 是 正确 的 (这 就 是 原子 操作 为 默认 属性 的 原因 )， 不 过 这 里 需要 详细 说 明 : 原 
子 操作 对 于 排序 要 求 ， 也 有 其 他 的 选项 ， 会 在 稍 后 进行 详 述 。 

现在 ， 你 已 经 了 解 了 “先行 发 生 " 和 “同步 发 生 " 操 作 ， 也 是 时 候 看 看 他 们 昌 正 的 意义 了 。 我 将 
从 “同步 发 生 ” 开 始 说 起 。 


5.3.1 同步 发 生 


“同步 发 生 ” ge oem I 
果 数 据 结构 包含 有 原子 类 型 ， 并 且 
发 生 关系 。 从 根本 上 说 ， . 


ie 。 例 如 对 一 个 数据 结构 进行 操作 (对 互 斥 量 上 人 锁 )， 如 
果 作 内 部 执行 了 一 定 的 原子 操作 ， 那 么 这 些 操作 就 是 同步 
能 来 源 于 对 原子 类 型 的 操作 。 


> = 


“同步 发 生 " 的 基本 想法 是 : 在 变量 X 进 行 适当 标记 的 原子 写 操作 W， 同 步 与 对 X 进 行 适当 标记 的 
原子 读 操作 ， 读 取 的 是 W 操 作 写 入 的 内 容 ; 或 是 在 W 之 后 ， 同 一 线程 上 的 原子 写 操作 对 X 写 入 
的 值 ; 亦 或 是 任意 线程 对 x 的 一 RIVE 子 读 - 改 - 写 操作 (例如 ，fetch_add() 或 

compare_exchange_weak())。 这 里 ， 第 一 个 线程 读 取 到 的 值 是 W 操 作 写 入 的 ( 详 见 5.3.4 节 )。 


先 将 “适当 的 标记 ” 放 在 一 边 ， 因 为 所 有 对 原子 类 型 的 操作 ， 上 默认 都 是 适当 标记 的 。 这 实际 上 就 
是 : 如 果 线 程 人 存储 了 一 个 值 ， 并且 线 程 B 读 取 了 这 个 值 ， 线程 人 的 存储 操作 与 线程 B 的 载 入 操 
作 就 是 同步 发 生 的 关系 ， 如 同 清单 5.2 所 示 的 那样 。 


我 确信 你 假设 过 ， 所 有 细微 的 差别 都 在 “适当 的 标记 "中 。 c++ 内 存 模型 允许 为 原子 类 型 提供 各 
种 约束 顺序 ， 并 且 这 个 标记 我 们 已 经 提 过 了 。 内 存 排 序 的 各 种 选项 和 它们 如 何 与 同步 发 生 的 
关系 ， 将 会 在 5.3.3 节 中 讨论 。 


让 我 们 先 退 一 步 ， 再 来 看 一 下 "先行 发 生 ? 关 系 。 


5.3.2 先行 发 生 


“先行 发 生 ” 关 系 是 一 个 程序 中 ， 基 本 构建 块 的 操作 顺序 ; 它 指定 了 ETE 影响 另 一 个 操 
作 。 对 于 单线 程 来 说 ， 就 简单 了 : 当 一 个 操作 排 在 另 一 个 之 后 ， 那 么 这 个 操作 就 是 先行 执行 
ce 这 意味 着 ， 如 果 源 码 中 操作 A 发 生 在 操作 B 之 前 ， 那 么 A 就 先行 于 B 发 生 。 你 可 以 回 看 清单 

: 对 data 的 写 入 回 先 于 对 data_ready@ 的 写 入 。 如 果 操 作 在 同时 发 生 ， 因 为 操作 间 无 序 执 
SE aie ae Dena obs ap aE AE Sagi rene et: 
会 输出 “1，2” 或 2，1”， 因 为 两 个 get_num() 的 执行 顺序 未 被 指定 。 


清单 5.3 对 于 参数 中 的 函数 调用 顺序 是 未 指定 顺序 的 


#include <iostream> 
void foo(int a,int b) 


{ 
std: :cout<<a<<”, ”<<b<<std::end1l; 
} 
int get_num() 
{ 


static int i=0; 
return ++i; 

} 

int main() 


{ 
foo(get_num(),get_num()); // 无 序 调用 get_num() 


这 种 情况 下 ， 操 作 在 单一 声明 中 是 可 测序 的 ， 例 如 ， 运 号 操作 符 的 使 用 ， 或 一 个 表达 式 的 结 
果 作 为 一 个 参数 传 给 另 一 个 表达 式 。 但 在 通常 情况 下 ， 操 作 在 单一 声明 中 是 不 可 测序 的 ， 所 
以 对 其 无 法 先行 安排 顺序 (也 就 没有 先行 发 生 了 )。 当 然 ， 所 有 操作 在 一 个 声明 中 先行 于 在 下 一 
个 声明 中 的 操作 。 


这 只 是 对 之 前 单线 程 排序 规则 的 重 述 ， 放 在 这 里 有 什么 新 意 吗 ? 有 新 意 的 是 线程 间 的 互相 作 
: 如 果 操 作 A 在 线程 上 ， 并 且 线 程 先 行 于 另 一 线程 上 的 操作 B， 那 么 A 就 先行 于 B。 这 也 没 什 
: 你 只 是 添加 了 一 个 新 关系 (线程 间 的 先行 )， 但 当 你 正在 编写 多 线程 程序 时 ， 是 就 这 是 一 个 
关 重 要 的 关系 了 。 


n a = > 


从 基本 层面 上 讲 ， 线 程 间 的 先行 比较 简单 ， 并 且 依 赖 与 同步 关系 ( 详 见 5.3.1 节 ): 如 果 操作 A 在 一 
个 线程 上 ， 与 另 一 个 线程 上 的 操作 B 同 步 ， 那么 A 就 线程 间 先 行 于 B。 这 同样 是 一 个 传递 关 
A: 如 果 A 线 程 间 先 行 于 B， 并 且 B 线 程 问 先行 于 C， 那 么 A 就 线程 问 先行 于 C。 你 可 以 回 看 一 

下 清单 5.2。 


线程 间 先 行 可 以 与 排序 先行 关系 相 结 合 : 如 果 操 作 人 A 排序 先行 于 操作 B， 并 且 操 作 B 线 程 间 先 
行 于 操作 C， 那 么 A 线 程 间 先行 于 C。 同 样 的 ， 如 果 A 同 步 于 B， 并 且 B 排 序 先 于 C， 那 么 A 线 程 
间 先 行 于 C。 两 者 的 结合 ， 意 味 着 当 你 对 数据 进行 一 系列 修改 (单线 程 ) 时 ， 为 线程 后 续 执行 

C， 只 需要 对 可 见 数据 进行 一 次 同步 。 


et 也 是 让 清单 5.2 正 常 运行 的 因素 。 并 在 数据 依赖 上 有 
一 些 细微 的 差别 ， 你 马上 就 会 看 到 。 为 了 让 你 理解 这 些 差别 ， 需 要 讲述 一 下 原子 操作 使 用 的 
a 些 标签 和 同步 发 生 之 间 的 联系 。 


5.3.3 原子 操作 的 内 存 顺序 


这 里 有 六 个 内 存 序列 选项 可 应 用 于 对 原子 类 型 的 操作 : memory_order_relaxed, 
memory_order_consume, memory_order_acquire, memory_order_release, 
memory_order_acq_rel, 以 及 memory_order_ seq_cst。 除 非 你 为 特定 的 操作 指定 一 个 序列 选 
项 ， 要 不 内 存 序列 选项 对 于 所 有 原子 类 型 默认 都 是 memory_order seq_cst。 虽 然 有 六 个 选 
项 ， 但 是 它们 仅 代表 三 种 内 存 模 型 : 排序 一 致 序列 (sequentially consistent)， 获 取 - 释 放 序 列 
(memory_order_consume, memory_order_acquire, memory_order_release 和 
memory_order_acq_rel)， 和 自由 序列 (memory_order_relaxed)。 


这 些 不 同 的 内 存 序 列 模型 ， 在 不 同 的 CPU 架构 下 ， 功 耗 是 不 一 样 的 。 例 如 ， 基 于 处 理 器 架构 
的 可 视 化 精细 操作 的 系统 ， 比 起 其 他 系统 ， 添 加 的 同步 指令 可 被 排序 一 致 序列 使 用 (在 获取 - 释 
放 序 列 和 自由 序列 之 前 )， 或 被 获取 -释放 序列 调用 (在 自由 序列 之 前 )。 如 果 这 些 系统 有 多 个 处 
理 器 ， 这 些 额 外 添加 的 同步 指令 可 能 会 消耗 大 量 的 时 间 ， 从 而 降低 系统 整体 的 性 能 。 另 一 方 
面 ，CPU 使 用 的 是 X86 或 X86-64 架 构 (例如 ， 使 用 Intel 或 AMD 处 理 器 的 台式 电脑 )， 使 用 这 种 架 
构 的 CPU 不 需要 任何 对 获取 -释放 序列 添加 额外 的 指令 (没有 保证 原子 性 的 必要 了 )， 并 且 ， 即 
使 是 排序 一 致 序列 ， 对 于 加 载 操 作 也 不 需要 任何 特殊 的 处 理 ， 不 过 在 进行 存储 时 ， 有 点 额外 
的 消耗 。 


不 同 种 类 的 内 存 序列 模型 ， 允 许 专 家 利用 其 提升 与 更 细 粒 度 排序 相关 操作 的 性 能 。 当 默认 使 
用 排序 一 致 序列 ( 相 较 于 其 他 序列 ， 它 是 最 简单 的 ) 时 ， 对 于 在 那些 不 大 重要 的 情况 下 是 有 利 
的 。 


选择 使 用 哪个 模型 ， 或 为 了 了 解 与 序列 相关 的 代码 ， 为 什么 选择 不 同 的 内 存 模型 ， 是 大 
re a a ial 下 选择 每 个 操作 
序列 和 同步 相关 的 结果 。 


排序 一 致 队列 


默认 序列 命名 为 排序 一 致 ， 是 因为 程序 中 的 行为 从 任意 角度 去 看 ， 序 列 顺序 都 保持 一 致 。 如 
果 原 子 类 型 实例 上 的 所 有 操作 都 是 序列 一 致 的 ， 那 么 一 个 多 线程 程序 的 行为 ， 就 以 某 种 特殊 
的 排序 执行 ， 好 像 单线 程 那样 。 这 是 目前 来 看 ， 最 容易 理解 的 内 存 序列 ， 这 也 就 是 将 其 设置 
为 默认 的 原因 : 所 有 线程 都 必须 了 解 ， 不 同 的 操作 也 遵守 相同 的 顺序 。 因 为 其 简单 的 行为 ， 
可 以 使 用 原子 变量 进行 编写 。 通 过 不 同 的 线程 ， 你 可 以 写 出 所 有 序列 上 可 能 的 操作 ， 这 样 就 
可 以 消除 那些 不 一 致 ， 以 及 验证 你 代码 的 行为 是 否 与 预期 相符 。 这 也 就 意味 着 ， MoA 
不 能 重 排序 ; 如 果 你 的 代码 ， 在 一 个 线程 中 ， 将 一 个 操作 放 在 另 一 个 操作 前 面 ， 那 么 这 个 顺 
序 就 必须 让 其 他 所 有 的 线程 所 了 解 。 


从 同步 的 角度 看 ， 对 于 同一 变量 ， 排 序 一 致 的 存储 操作 同步 相关 于 同步 一 致 的 载 入 操作 。 这 
就 提供 了 一 种 对 两 个 (以 上 ) 线 程 操作 的 排序 约束 ， 但 是 排序 一 致 的 功能 要 比 排序 约束 大 的 多 。 
所 以 ， 对 于 使 用 排序 一 致 原子 操作 的 系统 上 的 任 一 排序 一 致 的 原子 操作 ， 都 会 在 对 值 进 行 存 
储 以 后 ， 再 进行 加 载 。 清 单 5.4 就 是 这 种 一 致 性 约束 的 演示 。 这 种 约束 不 是 线程 在 自由 内 存 序 
列 中 使 用 原子 操作 ; 这 些 线程 依旧 可 以 知道 ， 操 作 以 不 同 顺序 排列 ， 所 以 你 必须 使 用 排序 一 
致 操作 ， 去 保证 在 多 线 的 情况 下 有 加 速 的 效果 。 


不 过 ， 简 单 是 要 付出 代价 的 。 在 一 个 多 核 若 排序 的 机 器 上 ， 它 会 加 强 对 性 能 的 惩罚 ， 因 为 整 
个 序列 中 的 操作 都 必须 在 多 个 处 理 器 上 保持 一 致 ， 可 能 需要 对 处 理 器 间 的 同步 操作 进行 扩展 
(代价 很 昂贵 ! )。 即 便 如 此 ， 一 些 处 理 器 架构 (比如 通用 x86 和 x86-64 架 构 ) 就 提供 了 相对 廉价 
的 序列 一 致 ， 所 以 你 需要 考虑 使 用 序列 一 致 对 性 能 的 影响 ， 这 就 需要 你 去 查阅 你 目标 处 理 器 
的 架构 文档 ， 进 行 更 多 的 了 解 。 


DR eh te de 
memory_order seq_cst， 不 过 在 这 段 代 码 中 ， 标 签 可 能 会 忽略 ， 因 为 其 是 默认 项 。 


清单 5.4 全 序 一 一 序列 一 致 
#include <atomic> 
#include <thread> 


#include <assert.h> 


std::atomic<bool> x,y; 
std: :atomic<int> z; 


void write_x() 


{ 
x.store(true,std::memory_order_seq_cst); // 1 
} 
void write_y() 
{ 
y.store(true,std::memory_order_seq_cst); // 2 
} 
void read_x_then_y() 
{ 


while(!x.load(std::memory_order_seq_cst)); 
if(y.load(std::memory_order_seq_cst)) // 3 


++Z ， 
} 
void read_y_then_x() 
{ 


while(!y.load(std::memory_order_seq_cst)); 
if(x.load(std::memory_order_seq_cst)) // 4 


++Z' 


} 


int main() 


{ 


x=false; 

y=false; 

z=0; 

std::thread a(write_x); 
std::thread b(write_y); 
std::thread c(read_x_then_y); 
std::thread d(read_y_then_x); 
a.join(); 

b.join(); 

c.join(); 

d.join(); 
assert(z.load()!=0); // 5 


assert@ 语 名 是 永远 不 会 触发 的 ， 因 为 不 是 存储 Xx 的 操作 加 发 生 ， 就 是 存储 y 的 操作 回 发 生 。 如 
果 在 read_x_then_y 中 加 载 y@ 返 回 false， 那 是 因为 存储 x 的 操作 肯定 发 生 在 存储 y 的 操作 之 

前 ， 那 么 在 这 种 情况 下 在 read_y _then_Xx 中 加 载 X@ 图 必定 会 返回 true， 因 为 While 循环 能 保证 在 
某 一 时 刻 y 是 true。 因 为 memory_order_ seq_cst 的 语义 需要 一 个 单 全 序 将 所 有 操作 都 标记 为 
memory_order_ seq_cst， 这 就 暗示 着 “加载 y 并 返回 false@" 与 "存储 y@" 的 操作 ， 有 一 个 确定 的 
顺序 。 只 有 一 个 全 序 时 ， 如 果 一 个 线程 看 到 X==true， 随 后 又 看 到 y==false， 这 就 意味 着 在 总 
序列 中 存储 x 的 操作 发 生 在 存储 y 的 操作 之 前 。 


当然 ， 因 为 所 有 事情 都 是 对 称 的 ， 所 以 就 有 可 能 以 其 他 方式 发 生 ， 比 如 ， 加 载 X@ 的 操作 返回 
false， 或 强制 加 载 y@ 的 操作 返回 true。 在 这 两 种 情况 下 ，Zz 都 等 于 1。 当 两 个 加 载 操作 都 返回 
true，z 就 等 于 2， 所 以 任何 情况 下 ，z 都 不 能 是 0。 


当 read_X_then_y 知 道 x 为 true， 并 且 y 为 false， 那 么 这 些 操作 就 有 " 先 发 执行 "关系 了 ， 如 图 5.3 
所 示 。 





| Initially x=false, y=false 


Dn 
y.store (true) 











y.load() 
returns true 


y.load() x.load() 
returns false returns true 






write_x read_x_then_y read_y_then_x write_y 


图 5.3 序列 一 致 与 先 发 执 行 


虚线 始 于 read_x_then_y 中 对 y 的 加 载 操 作 ， 到 达 write_y 中 对 y 的 存储 ， 其 暗示 了 排序 关系 需要 
保持 序列 一 致 : 在 操作 的 全 局 操作 顺序 memory_order_seq_cst 中 ， 加 载 操作 必须 在 存储 操作 
之 前 发 生 ， 就 产生 了 图 中 的 结果 


fm 致 是 最 简单 、 直 观 的 序列 ， 但 是 他 也 是 最 兄 贵 的 内 存 序列 ， 因 为 它 需 要 对 所 有 线程 进 
行 全 局 同步 。 在 一 个 多 处 理 系统 上 ， 这 就 需要 处 理 期 间 进 行 大 量 并 且 费 时 的 信息 交换 。 


为 了 避免 这 种 同步 消耗 ， 你 需要 走出 序列 一 致 的 世界 ， 并 且 考 虑 使 用 其 他 内 存 序列 。 
非 排序 一 致 内 存 模型 


当 你 路 出 序列 一 致 的 世界 ， 所 有 事情 就 开始 变 的 复杂 。 可 能 最 需要 处 理 的 问题 就 是 : 再 也 不 
会 有 全 局 的 序列 了 。 这 就 意味 着 不 同 线程 看 到 相同 操作 ， 不 一 定 有 着 相同 的 顺序 ， 还 有 对 于 
不 同 线程 的 操作 ， 都 会 整齐 的 ， 一 个 接着 另 一 个 执行 的 想法 是 需要 握 弃 的 。 不 仅 是 你 有 没有 
考虑 事情 监 的 同时 发 生 的 问题 ， 还 有 线程 没 必要 去 保证 一 致 性 。 为 了 写 出 (或 仅 是 了 解 ) 任 何 一 
段 使 用 非 默认 内 存 序列 的 代码 ， 要 想 做 这 件 事 情 ， 那 么 之 前 的 那 句 话 就 是 至 关 重 要 的 。 你 要 
知道 ， 这 不 仅仅 是 编译 器 可 以 重新 排列 指令 的 问题 。 即 使 线程 运行 相同 的 代码 ， 它 们 都 能 拒 
绝 遵循 事件 发 生 的 顺序 ， 因 为 操作 在 其 他 线程 上 没有 明确 的 顺序 限制 ; 因为 不 同 的 CPU 缓存 
和 内 部 缓冲 区 ， 在 同样 的 存储 空间 中 可 以 存储 不 同 的 值 。 这 非常 重要 ， 这 里 我 再 重申 一 
线程 没 必 要 去 保证 一 致 性 。 


不 仅 是 要 气 弃 交错 执行 操作 的 想法 ， 你 还 要 放弃 使 用 编译 器 或 处 理 器 重 排 指令 的 想法 。 在 没 
有 明确 的 顺序 限制 下 ， 唯 一 的 要 求 就 是 ， 所 有 线程 都 要 统一 对 每 一 个 独立 变量 的 修改 顺序 。 
对 不 同 变量 的 操作 可 以 体现 在 不 同 线程 的 不 同 序列 上 ， 提 供 的 值 要 与 任意 附加 顺序 限制 保持 
一 致 。 


踏 出 排序 一 致 世界 后 ， 最 好 的 示范 就 是 使 用 memory_order_relaxed 对 所 有 操作 进行 约束 。 
果 你 已 经 对 其 有 所 了 解 ， 那 么 你 可 以 跳 到 获取 -释放 序列 继续 阅读 ， 获 取 - Sey ree 
在 操作 间 引 入 顺序 关系 (并 且 收回 你 的 理智 )。 


自由 序列 


在 原子 类 型 上 的 操作 以 自由 序列 执行 ， 没 有 任何 同步 关系 。 在 同一 线程 中 对 于 同一 变量 的 操 
作 还 是 服从 先 发 执 行 的 关系 ， a 需要 相对 的 顺序 。 唯 一 的 要 求 是 ， 在 
访问 同一 线程 中 的 单个 原子 变量 不 能 重 排序 ; 当 一 个 给 定 线 程 已 经 看 到 一 个 原子 变量 的 特定 
值 ， 线 程 随后 的 读 操作 ii ante 量 较 早 的 那个 值 。 当 使 用 memory_order relaxed， 就 
不 需要 任何 额外 的 同步 ， 对 于 每 个 变量 的 修改 顺序 只 是 线程 间 共 享 的 事情 。 


为 了 演示 如 何不 去 限制 你 的 非 限制 操作 ， 你 只 需要 两 个 线程 ， 就 如 同 下 面 代码 清单 那样 。 
清单 5.5 非 限 制 操作 只 有 非常 少 的 顺序 要 求 


#include <atomic> 
#include <thread> 
#include <assert.h> 


std::atomic<bool> x,y; 
std: :atomic<int> z; 


void write_x_then_y() 

{ 
x.store(true,std::memory_order_relaxed); // 1 
y.store(true, std::memory_order_relaxed); // 2 

} 

void read_y_then_x() 

{ 
while(!y.load(std::memory_order_relaxed)); // 3 
if(x.load(std::memory_order_relaxed)) // 4 


++Z ， 


} 

int main() 

{ 
x=false; 
y=false; 
z=0; 
std::thread a(write_x_then_y); 
std::thread b(read_y_then_x); 
a.join(); 
b.join(); 
assert(z.load()!=0); // 5 


这 次 assert@ 可 能 会 触发 ， 因 为 加 载 X 的 操作 图 可 能 读 取 到 false， 即 使 加 载 y 的 操作 回 读 取 到 
true， 并 且 存 储 X 的 操作 @@ 先 发 与 存储 y 的 操作 @。Xx 和 y 是 两 个 不 同 的 变量 ， 所 以 这 里 没有 顺序 
去 保证 每 个 操作 产生 相关 值 的 可 见 性 。 


非 限 制 操 作对 于 不 同 变量 可 以 自由 重 排序 ， 只 要 它们 服从 任意 的 先 发 执 行 关系 即 可 (比如 ， 在 
同一 线程 中 )。 它 们 不 会 引入 同步 相关 的 顺序 。 清 单 5.5 中 的 先 发 执行 关系 如 图 5.4 所 示 ( 只 是 其 
中 一 个 可 能 的 结果 )。 尽 管 ， 在 不 同 的 存储 /加 载 操 作 间 有 着 先 发 执 行 关 系 ， 这 里 不 是 在 一 对 存 
储 于 载 入 之 间 了 ， 所 以 载 入 操作 可 以 看 到 “违反 ”顺序 的 存储 操作 。 


Initially x=false, y=false 


x.store (true, 
relaxed) 


y.store (true, y.load (relaxed) 
relaxed) returns true 


x. load (relaxed) 
returns false 





write_x_then_y read y then x 
图 5.4 非 限制 原子 操作 与 先 发 执行 
让 我 们 来 看 一 个 略微 复杂 的 例子 ， 其 有 三 个 变量 和 五 个 线程 。 
清单 5.6 非 限制 操作 一 一 多 线程 版 
#include <thread> 


#include <atomic> 
#include <iostream> 


Std: :atomic<int> x(0),y(0),z(0); // 1 
std::atomic<bool> go(false); // 2 


unsigned const loop_count=10; 


struct read_values 


{ 


Mie Menez 


ki 


read_values 
read_values 
read_values 
read_values 
read_values 


valuesi[loop_count]; 
values2[loop_count]; 
values3[loop_count]; 
values4[loop_count]; 
values5[loop_count]; 


void increment(std::atomic<int>* 


{ 
while(!go) 


std::this_thread::yield(); 
for(unsigned i=0;i<loop_count;++i) 


{ 


var_to_inc, read_values* values) 


// 3 自 旋 ， 等 待 信号 


values[i].x=x.load(std::memory_order_relaxed); 


values[i].y=y.load(std::memory_order_relaxed); 


values[i].z=z.load(std::memory_order_relaxed); 
var_to_inc->store(i+1,std::memory_order_relaxed); // 4 
std::this_thread::yield(); 


void read_vals(read_values* values) 


{ 
while(!go) 


std::this_thread::yield(); // 5 自 旋 ， 等 待 信号 
for(unsigned i1=0;i<loop_count;++i) 


{ 


values[i].x=x.load(std::memory_order_relaxed); 


values[i].y=y.load(std::memory_order_relaxed); 


values[i].z=z.load(std::memory_order_relaxed); 
std::this_thread::yield(); 


void print(read_values* v) 


{ 


for(unsigned i=0;i<loop_count;++i) 


{ 


if(i) 
Stout  COUCS< sy 
std: :cout<<"("<<v[i].x<<","<<v[i].y<<","<<v[i].z<<")"; 
} 


std::cout<<std::endl; 


int main() 

{ 
std::thread ti(increment, &x, values1); 
std::thread t2(increment, &y, values2); 
std::thread t3(increment, &z,values3) ; 
std::thread t4(read_vals, values4); 
std::thread t5(read_vals, values5); 


go=true; // 6 开始 执行 主 循环 的 信号 


t5.join(); 
t4.join(); 
t3.join(); 
t2.join(); 
t1.join(); 


print(valuesi1); // 7 打印 最 终结 果 
print(values2); 
print(values3); 
print(values4); 
print(values5); 


这 段 代码 本 质 上 很 简单 。 你 拥有 三 个 全 局 原子 变量 @@ 和 五 个 线程 。 每 一 个 线程 循环 10 次 ， 使 
用 memory_order relaxed 读 取 三 个 原子 变量 的 值 ， 并 且 将 它们 存储 在 一 个 数组 上 。 其 中 三 个 
线程 每 次 通过 循环 四 来 更 新 其 中 一 个 原子 变量 ， 这 时 剩 下 的 两 个 线程 就 只 负责 读 取 。 当 所 有 线 
程 都 "加 入 ”， 就 能 打印 出 来 每 个 线程 存 到 数组 上 的 值 了 。 


原子 变量 go@ 用 来 确保 循环 在 同时 退出 。 局 动 线程 是 昂贵 的 操作 ， 并 且 没有 明确 的 延迟 ， 第 
一 个 线程 可 能 在 最 后 一 个 线程 开始 前 结束 。 每 个 线程 都 在 等 待 go 变 为 true 前 都 在 进行 循环 
@@ 回 ， 并 且 一 旦 go 设置 为 true 所 有 线程 都 会 开始 运行 @。 


程序 一 种 可 能 的 输出 为 : 


(0,0,0), (1,0,0), (2,0,0), (3,0,0), (4,0,0), (5,7,0), (6,7,8), (7,9,8), 
(8,9,8), (9,9,10) 

C07 0 200.6074.) (ON 20) Cl sro 5) AUS, Oyo) (87676) (oy ty On 
(10,8,9),(10,9,10) 
(0,0,0)，(0,0,1)，(0,0,2)， (0,0,3), (0,0,4), 0070-5), (0,0,6), (0,0,7), 
(0,0,8), (0,0,9) 

Cal er CA -07502 141) Uy Opa e pono)? a aa C a 
(5,10,10),(9,10,10), (10,10,10) 

Coe C LC Chao he OM Ca E TA OE S 7 (7 (0 (Ce 
(8,8,9), (8,8,9) 


前 三 行 中 线程 都 做 了 更 新 ， 后 两 行 线程 只 是 做 读 取 。 每 三 个 值 都 是 一 组 x ，y 和 Zz， 并 按照 这 样 
的 顺序 依次 循环 。 对 于 输出 ， 需 要 注意 的 一 些 事 是 : 


1 第 一 组 值 中 x 增 1， 第 二 组 值 中 y 增 1， 并 且 第 三 组 中 z 增 1 。 

2，x 元 素 只 在 给 定 集中 增加 ，y 和 z 也 一 样 ， 但 是 增加 是 不 均匀 的 ， 并 且 相对 顺序 在 所 有 线程 
中 都 不 同 。 

3， 线 程 3 看 不 到 x 或 y 的 任何 更 新 ; 他 能 看 到 的 只 有 z 的 更 新 。 这 并 不 妨碍 别 的 线程 观察 z 的 更 
新 ， 并 同时 观察 x 和 y 的 更 新 


对 于 非 限制 操作 ， 这 个 结果 是 合法 的 ， 但 是 不 是 唯一 合法 的 输出 。 任 意 组 值 都 用 三 个 变量 保 
持 一 致 ， 值 从 0 到 10 依 次 递增 ， 并 且 线 程 递 增 给 定 变量 ， 所 以 打印 出 来 的 值 在 0 到 10 的 范围 内 
都 是 合法 的 。 


了 解 自 由 排序 


为 了 了 解 自由 序列 是 如 何 工作 的 ， 先 将 每 一 个 变量 想象 成 一 个 在 独立 房间 中 拿 着 记事 本 的 
人 。 他 的 记事 本 上 是 一 组 值 的 列表 。 你 可 以 通过 打 电 话 的 方式 让 他 给 你 一 个 值 ， 或 让 他 写 下 
一 个 新 值 。 如 果 你 告诉 他 写 下 一 个 新 值 ， 他 会 将 这 个 新 值 写 在 表 的 最 后 。 如 果 你 让 他 给 你 一 
个 值 ， 他 会 从 列表 中 读 取 一 个 值 给 你 。 


在 你 第 一 次 与 这 个 人 交谈 时 ， 如 果 你 问 他 要 一 个 值 ， 他 可 能 会 给 你 现在 列表 中 的 任意 值 。 如 
果 之 后 你 再 问 他 要 一 个 值 ， 它 可 能 会 再 给 你 同一 个 值 ， 或 将 列表 后 面 的 值 给 你 ， 他 不 会 给 你 
列表 上 端的 值 。 如 果 你 让 他 写 一 个 值 ， 并 且 随 后 再 问 他 要 一 个 值 ， 他 要 不 就 给 你 你 刚 告 诉 他 
的 那个 值 ， 要 不 就 是 一 个 列表 下 端的 值 。 


试想 当 他 的 笔记 本 上 开始 有 5，10，23，3，1，2 这 几 个 数 。 如 果 你 问 他 索要 一 个 值 ， 你 可 能 
获取 这 几 个 数 中 的 任意 一 个 。 如 果 他 给 你 10， 那 么 下 次 再 问 他 要 值 的 时 候 可 能 会 再 给 你 10， 
或 者 10 后 面 的 数 ， 但 绝对 不 会 是 5。 如 果 那 你 问 他 要 了 五 次 ， 他 就 可 能 回答 "10，10，1，2 ， 
2”。 如 果 你 让 他 写 下 42， 他 将 会 把 这 个 值 添加 在 列表 的 最 后 。 如 果 你 再 问 他 要 值 ， 他 可 能 会 
告诉 你 42”"， 直 到 有 其 他 值 写 在 了 后 面 并 且 他 认为 他 愿意 将 那个 数 告诉 你 。 


现在 ， 想 象 你 有 个 朋友 叫 Carl， 他 也 有 那个 计数 员 的 电话 。Carl 也 可 以 打 电 话 给 计算 员 ， 让 他 
写 下 一 个 值 或 获取 一 个 值 ， 他 对 Carl 回 应 的 规则 和 你 是 一 样 的 。 他 只 有 一 部 电话 ， 所 以 他 一 次 
只 能 处 理 一 个 人 的 请 求 ， 所 以 他 记事 本 上 的 列表 是 一 个 简单 的 列表 。 但 是 ， 你 让 他 写 下 一 个 

新 值 的 时 候 ， 不 意味 着 他 会 将 这 个 消息 告诉 Carl， 反 之 亦 然 。 如 果 Carl 从 他 那里 获取 一 个 

值 “23”， 之 后 因为 你 告诉 他 写 下 42， 这 不 意味 着 下 次 他 会 将 这 件 事 告诉 Carl。 他 可 能 会 告诉 

Carl 任 意 一 个 值 ， 23，3，1，2， fel EOL OG E EE 他 会 很 高 兴 的 告诉 
Carl“23，3，3，1，67”， 与 你 告诉 他 的 值 完 全 不 一 致 。 这 就 像 它 在 使 用 便签 跟踪 告诉 每 个 人 
的 数 ， 就 像 图 5.5 那 样 。 
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图 5.5 计数 员 的 笔记 


现在 ， 想 象 一 下 ， 不 仅仅 只 有 一 个 人 在 房间 里 ， 而 是 在 一 个 小 农场 里 ， 每 个 人 都 有 一 部 电话 

-o 这 就 是 我 们 的 原子 变量 。 每 一 个 变量 拥有 他 们 自己 的 修改 顺序 (笔记 上 的 简单 
数值 列表 )， 但 是 每 个 原子 变量 之 间 没 有 任何 关系 。 如 果 每 一 个 调用 者 (你 ，Carl， Anne， 

> 那么 对 每 个 操作 使 用 memory_order_relaxed 你 就 会 得 到 上 面 的 结 

果 。 这 里 还 有 些 事情 你 可 以 告诉 在 小 房子 的 人 ， 例 如 ，" 写 下 这 个 值 ， 并且 告诉 我 现在 列表 中 
的 最 后 一 个 值 "(exchange)， 或 “ 写 下 这 个 值 ， 当 列表 的 最 后 一 个 值 为 某 值 ; 如 果 不 是 ， 告 诉 我 
看 我 是 不 是 猿 对 了 "(compare_exchange_strong)， 但 是 这 都 不 影响 一 般 性 原则 。 


如 果 你 仔细 想 想 清单 5.5 的 逻辑 ， 那 么 write_x_then_y 就 像 某 人 打 电 话 给 房子 x 里 的 人 ， 并 且 告 
诉 他 写 下 true， 之 后 打 电 话 给 在 y 房 间 的 另 一 个 人 人， 告诉 他 写 下 true。 线 程 反 复 执 行 调用 
read_y then_Xx， 就 像 打 电话 给 房间 y 的 人 问 他 要 值 ， 直 到 要 到 true， 然 后 打 电 话 给 房间 X 的 ， 
继续 问 他 要 值 。 在 X 房 间 中 的 人 有 义务 告诉 你 在 他 列表 中 任意 指定 的 值 ， 他 也 是 有 权利 所 false 
的 。 


这 就 让 自由 的 原子 操作 变 得 难以 处 理 。 他 们 必须 与 原子 操作 结合 使 用 ， 这 些 原子 操作 必须 有 
较 强 的 排序 语义 ， 为 了 让 内 部 线程 同步 变 得 更 有 用 。 我 强烈 建议 避免 自由 的 原子 操作 ， 除 非 
它们 是 硬性 要 求 的 ， 并 且 在 使 用 它们 的 时 候 需 要 十 二 分 的 说 周 。 给 出 的 不 直观 的 结果 ， 就 像 
是 清单 5.5 中 使 用 双 线 程 和 双 变 量 的 结果 一 样 ， 不 难 想象 在 有 更 多 线程 和 更 多 变量 时 ， 其 会 变 
的 更 加 复杂 。 


要 想 获取 额外 的 同步 ， 且 不 使 用 全 局 排序 一 致 ， 可 以 使 用 获取 -释放 序列 (acquire-release 
ordering) ° 


获取 -释放 序列 


这 个 序列 是 自由 序列 (relaxed ordering) 的 加 强 版 ; 虽然 操作 依旧 没有 统一 的 顺序 ， 但 是 在 这 个 
序列 引入 了 同步 。 在 这 种 序列 模型 中 ， 原 子 加 载 就 是 获取 (acquire) 操 作 
(memory_order_acquire)， 原 子 存储 就 是 释放 (memory_order_release) 操 作 ， 原 子 读 - 改 - 写 操 
作 ( 例 如 fetch_add() 或 exchange()) 在 这 里 ， 不 是 “获取 ”， 就 是 “释放 ”， 或 者 两 者 兼 有 的 操作 
(memory_order acq_rel)。 这 里 ， 同 步 在 线程 释放 和 获取 间 是 成 对 的 (pairwise)。 释 放 操 作 与 
获取 操作 同步 ， 这样 就 能 读 取 已 写 入 的 值 。 这 意味 着 不 同 线程 看 到 的 序列 虽 还 是 不 同 ， 但 这 
些 序 列 都 是 受 限 的 。 下 面 列表 中 是 使 用 获取 -释放 序列 (而 非 序 列 一 致 方式 )， 对 清单 5.4 的 一 次 
重 写 。 


清单 5.7 获取 -释放 不 意味 着 统一 操作 顺序 


#include <atomic> 
#include <thread> 
#include <assert.h> 


std::atomic<bool> x,y; 
std::atomic<int> z; 
void write_x() 


{ 
x.store(true, std: :memory_order_release) ; 
} 
void write_y() 
{ 
y.store(true, std: :memory_order_release) ; 
} 
void read_x_then_y() 
{ 


while(!x.load(std: :memory_order_acquire) ); 
if(y.load(std::memory_order_acquire)) // 1 


++Z' 


void read_y_then_x() 

{ 
while(!y.load(std::memory_order_acquire) ); 
if(x.load(std::memory_order_acquire)) // 2 


++Z' 


} 

int main() 

{ 
x=false; 
y=false; 
z=0; 
std::thread a(write_x); 
std::thread b(write_y); 
std::thread c(read_x_then_y); 
std::thread d(read_y_then_x); 
a.join(); 
b.join(); 
c.join(); 
d.join(); 
assert(z.load()!=0); // 3 


在 这 个 例子 中 断言 四 可 能 会 触发 (就 如 同 自由 排序 那样 )， 因 为 可 能 在 加 载 X@ 和 y@ 的 时 候 ， 读 
取 到 的 是 false。 因 为 X 和 y 有 是 由 不 同 线程 写 入 ， 所 以 序列 中 的 每 一 次 释放 到 获取 都 不 会 影响 到 
其 他 线程 的 操作 。 


图 5.6 展 示 了 清单 5.7 的 先行 关系 ， 对 于 读 取 的 结果 ， 两 个 ( 读 取 ) 线 程 看 到 的 是 两 个 完全 不 同 的 
世界 。 如 前 所 述 ， 这 可 能 是 因为 这 里 没有 对 先行 顺序 进行 强制 规定 导致 的 。 





| Initially x=false, y=false 








x.store (true, y.store (true, 
release) release) 


x. load (acquire) y.load (acquire) 
returns true returns true 


y. load (acquire) x.load (acquire) 
returns false returns false 





write_x read_x_then_y read_y_then_x write_y 
图 5.6 获取 -释放 ， 以 及 先行 过 程 


为 了 了 解 获取 -释放 序列 有 什么 优点 ， 你 需要 考虑 将 两 次 存储 由 一 个 线程 来 完成 ， 就 像 清单 5.5 
那样 。 当 你 需要 使 用 memory_order_release 改 变 y 中 的 存储 ， 并 且 使 用 
memory_order_acquire 来 加 载 y 中 的 值 ， 就 像 下 面 程序 清单 所 做 的 那样 ， 而 后 ， 就 会 影响 到 序 
列 中 对 x 的 操作 。 


清单 5.8 获取 -释放 操作 会 影响 序列 中 的 释放 操作 


#include <atomic> 
#include <thread> 
#include <assert.h> 


std::atomic<bool> x,y; 
std: :atomic<int> z; 


void write_x_then_y() 
{ 
x.store(true,std::memory_order_relaxed); // 1 
y.store(true, std::memory_order_release); // 2 
} 
void read_y_then_x() 
{ 
while(!y.load(std::memory_order_acquire)); // 3 自 旋 ， 等 待 y 被 设 
置 为 true 
if(x.load(std::memory_order_relaxed)) // 4 


++Z; 


} 

int main() 

{ 
x=false; 
y=false; 
z=0; 
std::thread a(write_x_then_y); 
std::thread b(read_y_then_x); 
a.join(); 
b.join(); 
assert(z.load()!=0); // 5 


最 后 ， 读 取 y@@ 时 会 得 到 true， 和 存储 时 写 入 的 一 样 @。 因 为 存储 使 用 的 是 

memory_order release， 读 取 使 用 的 是 memory_order_acduire， 存 储 就 与 读 取 就 同步 了 。 因 
为 这 两 个 操作 是 由 同一 个 线程 完成 的 ， 所 以 存储 X@ 先 行 于 加 载 Y@D。 对 y 的 存储 同步 与 对 y 的 加 
载 ， 存 储 X 也 就 先行 于 对 y 的 加 载 ， 并 且 扩 展 先 行 于 X 的 读 取 。 因 此 ， 加 载 X 的 值 必 为 rue， 并 且 
断言 回 不 会 触发 。 如 果 对 于 y 的 加 载 不 是 在 while 循 环 中 ， 那 么 情况 可 能 就 会 有 所 不 同 ; 加 载 y 

的 时 候 可 能 会 读 取 到 false， 在 这 种 情况 下 对 于 读 取 到 的 x 是 什么 值 ， 就 没有 要 求 了 。 为 了 保证 


同步 ， 加 载 和 释放 操作 必须 成 对 。 所 以 ， 无 论 有 何 影响 ， 释 放 操 作 存 储 的 值 ， 必 须要 让 获取 
操作 看 到 。 当 存储 如 加 或 加 载 如 加， 都 是 一 个 释放 操作 时 ， 对 X 的 访问 就 无 序 了 ， 也 就 无 法 保 
证 图 处 读 到 的 是 true， 并 且 还 会 触发 断言 。 


你 也 可 以 将 获取 -释放 序列 与 之 前 提 到 记录 员 和 他 的 小 隔 间 相关 联 ， 不 过 你 可 能 需要 添加 很 多 
东西 到 这 个 模型 中 。 首 先 ， 试想 每 个 存储 操作 做 一 部 分 更 新 ， 那 么 当 你 电话 给 一 个 人 ， 让 他 
写 下 一 个 数字 ， 你 也 需要 告诉 他 更 新 哪 一 部 分 :“ 请 在 423 组 中 写 下 99”。 对 于 某 一 组 的 最 后 一 
个 值 的 存储 ， 你 也 需要 告诉 那个 人 : “请 写 下 147， 这 是 最 后 存储 在 423 组 的 值 "。 小 隔 间 中 的 
人 会 即使 写 下 这 一 信息 ， 以 及 告诉 他 的 值 。 这 个 就 是 存储 -释放 操作 的 模型 。 下 一 次 ， 你 告诉 
另外 一 个 人 号 下 一 组 值 时 ， 你 需要 改变 组 号 :“ 请 在 组 424 中 写 入 41” 


当 你 询问 一 个 时 ， 你 就 要 做 出 一 个 选择 : 你 要 不 就 仅仅 询问 一 个 值 (这 就 是 一 次 自由 加 载 ， 这 
种 情况 下 ， 小 隔 间 中 的 人 会 给 你 的 )， 要 不 询问 一 个 值 以 及 其 关于 组 的 信息 (是 否 是 某 组 中 的 最 
后 一 个 ， 这 就 是 加 载 -获取 模型 )。 当 你 询问 组 信息 ， 且 值 不 是 组 中 的 最 后 一 个 ， 隔 间 中 的 人 会 
这 样 告诉 你 ，“ 这 个 值 是 987， 它 是 一 个 ' 普 通 ' 值 ”， 但 当 这 个 值 是 最 后 一 个 时 ， 他 会 告诉 

你 :“ 数 字 为 987， 这 个 值 是 956 组 的 最 后 一 个 ， 来 源 于 Anne”。 现 在 ， 获 取 - 释 放 的 语义 就 很 明 
确 了 : 当 你 查询 一 个 值 ， 你 告诉 他 你 知道 到 所 有 组 后 ， 她 会 低头 查看 他 的 列表 ， 看 你 知道 的 

这 些 数 ， 是 不 是 在 对 应 组 的 最 后 ， 并 且 告 诉 你 那个 值 的 属性 ， 或 继续 在 列表 中 查询 。 


如 何 理解 这 个 模型 中 获取 -释放 的 语义 ? 让 我 们 看 一 下 我 们 的 例子 。 首 先 ， 线 程 a 运 行 
Write_x_then_y 元 数 ， 然 后 告诉 在 x 屋 的 记录 员 ，“ 请 写 下 true 作 为 组 1 的 一 部 分 ， 信 息 来 源 于 线 
程 9”， 之 后 记录 员工 整 的 写 下 了 这 些 信息 。 而 后 ， 线 程 9 告 诉 在 y 屋 的 记录 员 ，“ 请 写 下 true 作 
为 组 1 的 一 部 分 ， 信 息 来 源 于 线程 a"。 在 此 期 间 ， 线 程 b 运 行 read_y then_x。 线 程 b 桂 续 向 y 屋 
的 记录 员 询 问 值 与 组 的 信息 ， 直 到 它 听 到 记录 员 说 true”。 记 录 员 可 能 不 得 不 告诉 他 很 多 遍 ， 
不 过 最 终 记 录 员 还 是 说 了 “true”。y 屋 的 记录 员 不 仅仅 是 说 "true”， 他 还 要 说 “组 1 最 后 是 由 线程 9 
BAe 


现在 ， 线 程 b 会 持续 询问 x 屋 的 记录 员 ， 但 这 次 他 会 说 "请 给 我 一 个 值 ， 我 知道 这 个 值 是 组 1 的 
值 ， 并 且 是 由 线程 a 写 入 的 9。 所 以 现在 ，x 屋 中 的 记录 员 就 开始 查找 组 1 中 由 线程 a 写 入 的 值 。 
这 里 他 注意 到 ， 他 写 入 的 值 是 true， 同 样 也 是 他 列表 中 的 最 后 一 个 值 ， 所 以 它 必 须 读 出 这 个 
值 ; 否则 ， 他 讲 打破 这 个 游戏 的 规则 。 


当 你 回 看 5.3.2 节 中 对 “线程 间 先 行 "的 定义 ， 一 个 很 重要 的 特性 就 是 它 的 传递 : 当 A 线 程 间 先行 
于 B， 并 且 B 线 程 间 先行 于 C， 那 么 A 就 线程 间 先 行 于 C。 这 就 意味 着 ， 获 取 - 释 放 序 列 可 以 在 车 
干线 程 间 使 用 同步 数据 ， 其 至 可 以 在 中间" 线程 接触 到 这 些 数据 前 ， 使 用 这 些 数据 。 


与 同步 传递 相关 的 获取 -释放 序列 


为 了 考虑 传递 顺序 ， 你 至 少 需要 三 个 线程 。 第 一 个 线程 用 来 修改 共享 变量 ， 并 且 对 其 中 一 个 
做 “存储 -释放 "处 理 。 然 后 第 二 个 线程 使 用 “加载 -获取 "” 读 取 由 “存储 -释放 "操作 过 的 变量 ， 并 且 
再 对 第 二 个 变量 进行 “存储 -释放 "操作 。 最 后 ， 由 第 三 个 线程 通过 “加 载 -获取 ” 读 取 第 二 个 共享 
变量 。 提 供 “ 加 载 -获取 "操作 ， 来 读 取 被 “存储 -释放 ”操作 写 入 的 值 ， 是 为 了 保证 同步 关系 ， 这 
里 即便 是 中 间 线 程 没有 对 共享 变量 做 任何 操作 ， 第 三 个 线程 也 可 以 读 取 被 第 一 个 线程 操作 过 
的 变量 。 下 面 的 代码 可 以 用 来 描述 这 样 的 场景 。 


清单 5.9 使 用 获取 和 释放 顺序 进行 同步 传递 


std: :atomic<int> data[5]; 
std::atomic<bool> sync1i(false),sync2(false); 


void thread_1() 

{ 
data[0].store(42,std::memory_order_relaxed); 
data[1].store(97,std::memory_order_relaxed); 
data[2].store(17,std::memory_order_relaxed); 
data[3].store(-141, std: :memory_order_relaxed); 
data[4].store(2003, std: :memory_order_relaxed); 
synci.store(true,std::memory_order_release); // 1.7% @synci 


void thread_2() 
{ 
while(!sync1.load(std::memory_order_acquire)); // 2. 直 到 Sync1 
设置 后 ， 循 环 结束 
sync2.store(true,std::memory_order_release); // 3. 设 置 Sync2 
} 
void thread_3() 
{ 
while(!sync2.load(std::memory_order_acquire) ); // 4. 直 到 Sync1 
设置 后 ， 循 环 结束 
assert(data[0].load(std: :memory_order_relaxed)==42) ; 
assert(data[1].load(std: :memory_order_relaxed)==97); 
assert(data[2].load(std: :memory_order_relaxed)==17); 
assert(data[3].load(std: :memory_order_relaxed)==-141); 
assert(data[4].load(std: :memory_order_relaxed )==2003) ; 


尽管 thread_2 只 接触 到 变量 syn1@ 和 sync2@， 不 过 这 对 于 thread_1 和 thread 3 的 同步 就 足够 
了 ， 这 就 能 保证 断言 不 会 触发 。 首 先 ，thread 1 将 数据 存储 到 data 中 先行 于 存储 sync1@ ( 它 
们 在 同一 个 线程 内 ) 。 因 为 加 载 sSync1@ 的 是 一 个 while 循 环 ， 它 最 终 会 看 到 thread 1 存储 的 值 
(是 从 "释放 -获取 "对 的 后 半 对 获取 )。 因 此 ， 对 于 sync1 的 存储 先行 于 最 终 对 于 sync1 的 加 载 (在 
While 循环 中 )。thread_3 的 加载 操 作 @@， 位 于 存储 sync2@@ 操 作 的 前 面 (也 就 是 先行 )。 存 储 
sync2@ 因 此 先行 于 thread 3 的 加 载 田 ， 加 载 又 先行 于 存储 Sync2@@， 存 储 sync2 又 先行 于 加 载 
sync2@， 加 载 syn2 又 先行 于 加 载 data。 因 此 ，thread 1 存储 数据 到 data 的 操作 先行 于 
thread 3 中 对 data 的 加 载 ， 并 且 保 证 断言 都 不 会 触发 。 


在 这 个 例子 中 ， 你 可 以 将 sync1 和 sync2， 通 过 Tea _2 中 使用“ 读 - 改 - 写 ”操作 
(memory_order_acq_rel)， 将 其 合并 成 一 个 独立 的 变 其 中 会 使 用 
compare_exchange_strong() 来 保证 thread_1 对 变量 只 进 eee : 


std: :atomic<int> sync(0); 

void thread_1() 

{ 
/er 
sync.store(1,std::memory_order_release); 


void thread_2() 
{ 
int expected=1; 
while(!sync.compare_exchange_strong(expected, 2, 
std: :memory_order_acq_rel) ) 





expected=1; 


} 

void thread_3() 

{ 
while(sync.load(std: :memory_order_acquire)<2); 
Eee 

} 


如 果 你 使 用 " 读 - 改 - 写 ?" 操 作 ， 选 择 语义 就 很 重要 了 。 在 这 个 例子 中 ， 你 想 要 同时 进行 获取 和 释 
放 的 语义 ， 所 以 memory_order_acq_rel 是 一 个 合适 的 选择 ， 但 你 也 可 以 使 用 其 他 序列 。 使 用 
memory_order_ acquire 语 义 的 fetch_sub 是 不 会 和 任何 东西 同步 的 ， 即 使 它 存储 了 一 个 值 ， 这 
是 因为 其 没有 释放 操作 。 同 样 的 ， 使 用 memory_order release 语义 的 fetch_or 也 不 会 和 任何 
存储 操作 进行 同步 ， 因 为 对 于 fetch_or 的 读 取 ， 并 不 是 一 个 获取 操作 。 使 用 
memory_order_acq_rel 语 义 的 “ 读 - 改 - 写 " 操 作 ， 每 一 个 动作 都 包含 获取 和 释放 操作 ， 所 以 可 以 
和 之 前 的 存储 操作 进行 同步 ， 并 且 可 以 对 随后 的 加 载 操作 进行 同步 ， 就 像 上 面 例子 中 那样 。 


如 果 你 将 “获取 -释放 "操作 和 “序列 一 致 "操作 进行 混合 ，“ 序 列 一 致 "的 加 载 动作 ， 就 像 使 用 了 获 
取 语 义 的 加 载 操 作 ; 并 且 序列 一 致 的 存储 操作 ， 就 如 使 用 了 释放 语义 的 存储 。" 序 列 一 致 "的 
读 - 改 - 写 操作 行为 ， 就 像 同时 使 用 了 获取 和 释放 的 操作 。“ 自 由 操作 ”依旧 那么 自由 ， 但 其 会 和 
额外 的 同步 进行 绑 定 〈 也 就 是 使 用 "获取 -释放 "的 语义 ) 。 


尽管 潜在 的 结果 并 不 那么 每 个 使 用 锁 的 同学 都 不 得 不 去 解决 同一 个 序列 问题 : 锁 住 互 
矿 量 是 一 个 获取 操作 ， ANG SER MERRIE HL EOD ， 你 必须 确 
保 同 一 个 互 斥 量 在 你 读 取 变 量 或 修改 变量 的 时 候 是 锁 住 的 ， 并 且 同 样 适合 于 这 里 ; 你 的 获取 


和 释放 操作 必须 在 同 人 ， 以 保证 访问 顺序 。 当 数据 被 一 个 互 斥 量 所 保护 时 ， 锁 的 性 


质 就 保证 得 到 的 结果 是 没有 区 别 的 ， 因 为 锁 住 与 解锁 的 操作 都 是 序列 一 致 的 操作 。 同 样 的 ， 
当 你 对 原子 变量 使 用 获取 和 释放 序列 ， 为 的 是 构建 一 个 简单 的 锁 ， 那 么 这 里 的 代码 必然 要 使 
用 锁 ， 即 使 内 部 操作 不 是 序列 一 致 的 ， 其 外 部 表现 将 会 是 序列 一 致 的 。 


当 你 的 原子 操作 不 需要 严格 的 序列 一 致 序列 ， 成 对 同步 的 “获取 -释放 "序列 可 以 提供 ， 比 全 局 
序列 一 致 性 操作 ， 更 加 低廉 的 潜在 同步 。 这 里 还 需要 对 心理 代价 进行 权衡 ， 为 了 保证 序列 能 
够 正常 的 工作 ， 还 要 保证 非 直 观 的 跨 线程 行为 是 没有 问题 的 。 


获取 -释放 序列 和 memory_order_consume 的 数据 相关 性 


在 介绍 本 章节 的 时 候 ， 我 说 过 ，memory_order_consume 是 “获取 -释放 ”序列 模型 的 一 部 分 ， 
但 是 在 前 面 我 们 没有 对 其 进行 过 多 的 讨论 。 这 是 因为 memory_order_consume 很 特别 : € Z 
全 依赖 于 数据 ， 并 且 其 展示 了 与 线程 间 先 行 关系 (可 见 5.3.2 节 ) 的 不 同 之 处 。 


这 里 有 两 种 新 关系 用 来 处 理 数据 依赖 : 前 序 依赖 (dependency-ordered-before) 和 携带 依赖 
(carries-a-dependency-to)。 就 像 前 列 (sequenced-before)， 携 带 依 赖 对 于 数据 依赖 的 操作 ， 
严格 应 用 于 一 个 独立 线程 和 其 基本 模型 ; 如 果 人 A 操作 结果 要 使 用 操作 BB 的 操作 数 ， 而 后 人 将 扒 
带 依 赖 于 B。 如 果 信 操作 的 结果 是 一 个 标量 ， 上 比如 int， 而 后 的 携带 依赖 关系 仍然 适用 于 ， 当 A 
的 结果 存储 在 一 个 变量 中 ， 并 且 这 个 变量 需要 被 其 他 操作 使 用 。 这 个 操作 是 也 是 可 以 传递 
的 ， 所 以 当 A 携 带 依赖 B， 并 且 B 携 带 依赖 C， 就 额 可 以 得 出 A 携 带 依赖 C 的 关系 。 

当 其 不 影响 线程 间 的 先行 关系 时 ， 对 于 同步 来 说 ， 这 并 未 带 来 任何 的 好 处 ， 但 是 它 做 到 : SA 
前 序 依赖 B， 那 么 A 线 程 间 也 前 序 依赖 B。 


这 种 内 存 序列 的 一 个 很 重要 使 用 方式 ， 是 在 原子 操作 载 入 指向 数据 的 指针 时 。 当 使 用 
memory_order_consume 作 为 加 载 语义 ， 并 且 memory_order_release 作 为 之 前 的 存储 语义 ， 
你 要 保证 指针 指向 的 值 是 已 同步 的 ， 并 且 不 需要 对 其 他 任何 非 独 立 数据 施加 任何 同步 要 求 。 
下 面 的 代码 就 展示 了 这 么 一 个 场景 。 


清单 5.10 使 用 std::memroy_order_consume 同步 数据 


struct X 

{ 

int i; 
std::string S; 


}; 


std::atomic<X*> p; 
std::atomic<int> a; 


void create_x() 

{ 
X* x=new X; 
X->1=42; 
x->s="hello"; 
a.store(99,std::memory_order_relaxed); // 1 
p.store(x,std::memory_order_release); // 2 


void use_x() 
{ 
XA, 
while(!(x=p.load(std::memory_order_consume))) // 3 
std::this_thread::sleep(std::chrono: :microseconds(1)); 
assert(x->1==42); // 4 
assert(x->s=="hello"); // 5 
assert(a.load(std: :memory_order_relaxed)==99); // 6 


int main() 

{ 
std::thread ti(create_x); 
std::thread t2(use_x); 
t1.join(); 
t2.join(); 


尽管 ， 对 a 的 存储 加 在 存储 p 驯 之前， 并 且 存 储 p 的 操作 标记 为 memory_order_release， 加 载 
p 国 的 操作 标记 为 memory_order_consume， 这 就 意味 着 存储 p 仅 先行 那些 需要 加 载 p 的 操作 。 
同样 ， 也 意味 着 X 结 构 体 中 数据 成 员 所 在 的 断言 语句 回回 不 会 被 触发 ， 这 是 因为 对 Xx 变量 操作 


的 表达 式 对 加 载 p 的 操作 携带 有 依赖 。 另 一 方面 ， 对 于 加 载 变量 a@ 的 断言 就 不 能 确定 是 否 会 
被 触发 ; 这 个 操作 并 不 依赖 于 p 的 加 载 操作 ， 所 以 这 里 没 法 保证 数据 已 经 被 读 取 。 当 然 ， 这 个 
情况 也 是 很 明显 的 ， 因 为 这 个 操作 被 标记 为 memory_order_relaxed 。 


有 时 ， 你 不 想 为 携带 依赖 增加 其 他 的 开销 。 你 想 让 编译 器 在 寄存 器 中 缓存 这 些 值 ， 以 及 优化 
重 排序 操作 代码 ， 而 不 是 对 这 些 依赖 大 惊 小 怪 。 这 种 情况 下 ， 你 可 以 使 

用 std::kill dependecy() 来 显 式 打破 依赖 链 。 std::kill dependency() 是 一 个 简单 的 函数 模 
板 ， 其 会 复制 提供 的 参数 给 返回 值 ， 但 是 依旧 会 打破 依赖 链 。 例 如 ， 当 你 拥有 一 个 全 局 的 只 
读数 组 ， 当 其 他 线程 对 数组 索引 进 行 检 索 时 ， 你 使 用 的 是 std: :memory_order_consume ， 那么 
你 可 以 使 用 std::kill_dependency() 让 编译 器 知道 这 里 不 需要 重新 读 取 该 数组 的 内 容 ， 就 像 下 
面 的 例子 一 样 : 


int global_data[]={ .. }; 
std::atomic<int> index; 


void f() 
{ 


int i=index.load(std::memory_order_consume) ; 
do_something_with(global_data[std::kill_dependency(i)]); 


当然 ， 你 不 需要 在 如 此 简单 的 场景 下 使 用 std::memory_order_consume ， 但 是 你 可 以 在 类 似 情 
况 ， 且 代码 较为 复杂 时 ， std::kill_dependency() 。 你 必须 记 住 ， 这 是 为 了 优化 ， 所 以 这 


种 方式 必须 说 惯 使 用 ， 并 且 需 能 数据 证 明 其 存在 的 意义 。 
现在 ， 我 们 已 经 讨论 了 所 有 基本 内 存 序列 ， 是 时 候 看 看 更 加 复杂 的 同步 关系 了 一 一 一 一 释放 
队列 o 


5.3.4 释放 队列 与 同步 


回 到 5.3.1 节 ， 我 提 到 过 ， 通 过 其 他 线程 ， 即 使 有 (有 序 的 ) 多 个 “ 读 - 改 - 写 " 操 作 (所 有 操作 都 已 经 
做 了 适当 的 标记 ) 在 存储 和 加 载 操作 之 间 ， 你 依旧 可 以 获取 原子 变量 存储 与 加 载 的 同步 关系 。 
现在 ， 我 已 经 讨论 所 有 可 能 使 用 到 的 内 存 序 列 “ 标 签 ”， 我 在 这 里 可 以 做 一 个 简单 的 概述 。 当 存 
储 操作 被 标记 为 memory_order _release，memory_order_acq_rel 或 

memory_order_ seq_cst， 加 载 被 标记 为 memory_order_consum，memory_order_acquire 或 
memory_order sqy_cst， 并 且 操 作 链 上 的 每 一 加 载 操 作 都 会 读 取 之 前 操作 写 入 的 值 ， 因 此 链 
上 的 操作 构成 了 一 个 释放 序列 (release sequence)， 并 且 初 始 化 存储 同步 (对 应 
memory_order_acquire 或 memory_order_seq_cst) 或 是 前 序 依赖 ( 对 应 
memory_order_consume) 的 最 终 加 载 。 操 作 链 上 的 任何 原子 " 读 - 改 - 写 ?操作 可 以 拥有 任意 个 存 
储 序列 (甚至 是 memory_order_relaxed)。 


为 了 了 解 这 些 操作 意味 着 什么 ， 以 及 其 重要 性 ， 考 虑 一 个 atomic 用 作对 一 个 共享 队列 的 元 素 
进行 计数 : 


清单 5.11 使 用 原子 操作 从 队列 中 读 取 数 据 


#include <atomic> 
#include <thread> 


std::vector<int> queue_data; 
std::atomic<int> count; 


void populate_queue( ) 

{ 
unsigned const number_of_items=20; 
queue_data.clear(); 
for(unsigned i=0;i<number_of_items;++i) 
{ 


queue_data.push_back(i); 


count.store(number_of_items,std::memory_order_release); // 1 
初始 化 存储 
} 


void consume_queue_items() 
{ 
while(true) 
{ 
int item_index; 
if((item_index=count.fetch_sub(1, std: :memory_order_acquire) ) 
<=0) // 2 一 个 “ 读 - 改 - 写 " 操 作 
{ 
wait_for_more_items(); // 3 等 待 更 多 元 素 
continue; 
} 


process(queue_data[item_index-1]); // 4 安全 读 取 queue_data 


int main() 


{ 


std::thread a(populate_queue); 
std::thread b(consume_queue_items); 
std::thread c(consume_queue_items); 
a.join(); 

b.join(); 

c.join(); 


一 种 处 理 方式 是 让 线程 产生 数据 ， 并 存储 到 一 个 共享 缓存 中 ， 而 后 调用 
count.store(number_of_items, memory_order_release)@ 让 其 他 线程 知道 数据 是 可 用 的 。 线 
程 群 消耗 着 队列 中 的 元 素 ， 之 后 可 能 调用 count.fetch_sub(1, memory_order_acquire)@ 向 队 
列 索 取 一 个 元 素 ， 不 过 在 这 之 前 ， 需 要 对 共享 缓存 进行 完整 的 读 取 @。 一 旦 count 归 零 ， 那 么 
队列 中 就 没有 更 多 的 元 素 了 ， 当 元 素 耗 尽 时 线程 必须 等 待 @ 。 


当 有 一 个 消费 者 线程 时 还 好 ，fetch_sub() 是 一 个 带 有 memory_order_acquire 的 读 取 操作 ， 并 
且 存 储 操作 是 带 有 memory_order _ release 语义 ， 所 以 这 里 存储 与 加 载 同 步 ， 线 程 是 可 以 从 组 
存 中 读 取 元 素 的 。 当 有 两 个 读 取 线 程 时 ， 第 二 个 fetch_sub() 操 作 将 看 到 被 第 一 个 线程 修改 的 
值 ， 且 没有 值 通过 store 写 入 其 中 。 先 不 管 释放 序列 的 规则 ， 这 里 第 二 个 线程 与 第 一 个 线程 不 
存在 先行 关系 ， 并 且 其 对 共享 缓存 中 值 的 读 取 也 不 安全 ， 除 非 第 一 个 fetch_sub() 是 带 有 
memory_order release 语 义 的 ， 这 个 语义 为 两 个 消费 者 线程 间 建 立 了 不 必要 的 同步 。 无 论 是 
释放 序列 的 规则 ， 还 是 带 有 memory_order_release 语 义 的 fetch_sub 操 作 ， 第 二 个 消费 者 看 到 
的 是 一 个 空 的 queue_data， 无 法 从 其 获取 任何 数据 ， 并 且 这 里 还 会 产生 条 件 竞 争 。 幸 运 的 
是 ， 第 一 个 fetch_sub() 对 释放 顺序 做 了 一 些 事情 ， 所 以 store() 能 同步 与 第 二 个 fetch_sub() 操 
作 。 这 里 ， 两 个 消费 者 线程 间 不 需要 同步 关系 。 这 个 过 程 在 图 5.7 中 展示 ， 其 中 虚线 表示 的 就 
是 释放 顺序 ， 实 线 表 示 的 是 先行 关系 。 
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图 5.7 清单 5.11 中 对 队列 操作 的 释放 顺序 


操作 链 中 可 以 有 任意 数量 的 链接 ， 但 是 提供 的 都 是 “ 读 - 改 - 写 " 操 作 ， 比 如 fetch_sub()， 
store()， 每 一 个 都 会 与 使 用 memory_order_acquire 语 义 的 操作 进行 同步 。 在 这 里 例子 中 ， 所 
有 链接 都 是 一 样 的 ， 并 且 都 是 获取 操作 ， 但 它们 可 由 不 同 内 存 序 列 语义 组 成 的 操作 混合 。( 译 
者 : 也 就 是 不 是 单纯 的 获取 操作 ) 


虽然 ， 大 多 数 同步 关系 ， 是 对 原子 变量 的 操作 应 用 了 内 存 序列 ， 但 这 里 依 昌 有 必要 额外 介绍 
一 个 对 排序 的 约束 一 一 栅栏 (fences)。 


5.3.5 栅栏 


如 果 原 子 操作 库 缺 少 了 栅栏 ， 那 么 这 个 库 就 是 不 完整 的 。 栅 栏 操 作 会 对 内 存 序列 进行 约束 ， 
使 其 无 法 对 任何 数据 进行 修改 ， 典 型 的 做 法 是 与 使 用 memory_order_relaxed 约 束 序 的 原子 操 
作 一 起 使 用 。 栅 栏 属于 全 局 操作 ， 执 行 栅栏 操作 可 以 影响 到 在 线程 中 的 其 他 原子 操作 。 因 为 
这 类 操作 就 像 画 了 一 条 任何 代码 都 无 法 跨越 的 线 一 样 ， 所 以 栅栏 操作 通常 也 被 称 为 内 存 栅栏 
(memory barriers)。 回 忆 一 下 5.3.3 节 ， 自 由 操作 可 以 使 用 编译 器 或 者 硬件 的 方式 ， 在 独立 的 
变量 上 自由 的 进行 重新 排序 。 不 过 ， 栅 栏 操作 就 会 限制 这 种 自由 ， 并 且 会 介绍 之 前 没有 介绍 
到 的 “先行 "和 “同步 "关系 。 


我 们 给 在 不 同 线程 上 的 两 个 原子 操作 中 添加 一 个 栅栏 ， 代 码 如 下 所 示 : 


清单 5.12 栅栏 可 以 让 自由 操作 变 的 有 序 


#include <atomic> 
#include <thread> 
#include <assert.h> 


std::atomic<bool> x,y; 
std: :atomic<int> z; 


void write_x_then_y() 

{ 
x.store(true, std::memory_order_relaxed); // 1 
std::atomic_thread_fence(std::memory_order_release); // 2 
y.store(true,std::memory_order_relaxed); // 3 


void read_y_then_x() 

{ 
while(!y.load(std::memory_order_relaxed)); // 4 
std::atomic_thread_fence(std::memory_order_acquire); // 5 
if(x.load(std::memory_order_relaxed)) // 6 


++Z; 


int main() 
{ 
x=false; 
y=false; 
z=0; 
std::thread a(write_x_then_y); 
std::thread b(read_y_then_x); 
a.join(); 
b.join(); 
assert(z.load()!=0); // 7 


释放 栅栏 @ 与 获取 栅栏 加 同步， 这 是 因为 加 载 y 的 操作 图 读 取 的 是 在 加 处 存储 的 值 。 所 以 ， 在 
@ 处 存储 Xx 先行 于 @ 处 加 载 x， 最 后 x 读 取出 来 必 为 true， 并 且 断 言 不 会 被 触发 四 。 原 先 不 带 栅 栏 
的 存储 和 加 载 x 都 是 无 序 的 ， 并 且 断 言 是 可 能 会 触发 的 。 需 要 注意 的 是 ， 这 两 个 栅栏 都 是 必要 


的 : 你 需要 在 一 个 线程 中 进行 释放 ， 然 后 在 另 一 个 线程 中 进行 获取 ， 这 样 才能 构建 出 同步 关 


在 这 个 例子 中 ， 如 果 存 储 y 的 操作 回 标记 为 memory_order_release， 而 非 

memory_order_ relaxed 的 话 ， 释 放 栅 栏 @ 也 会 对 这 个 操作 产生 影响 。 同 样 的 ， 当 加 载 y 的 操作 
@ 标 记 为 memory_order_acquire 时 ， 获 取 栅 栏 加 也 会 对 之 产生 影响 。 使 用 栅栏 的 一 般 想法 

是 : 当 一 个 获取 操作 能 看 到 释放 栅栏 操作 后 的 存储 结果 ， 那 么 这 个 栅栏 就 与 获取 操作 同步 ; 
并 且 ， 当 加 载 操作 在 获取 栅栏 操作 前 ， 看 到 一 个 释放 操作 的 结果 ， 那 么 这 个 释放 操作 同步 于 
获取 栅栏 。 当 然 ， 你 也 可 以 使 用 双边 栅栏 操作 ， 举 一 个 简单 的 例子 ， 当 一 个 加 载 操作 在 获取 
栅栏 前 ， 看 到 一 个 值 有 存储 操作 写 入 ， 且 这 个 存储 操作 发 生 在 释放 栅栏 后 ， 那 么 释放 栅栏 与 
获取 栅栏 是 同步 的 。 


虽然 ， 栅 栏 同步 依赖 于 读 取 / 写 入 的 操作 发 生 于 栅栏 之 前 /| 后 ， 但 是 这 里 有 一 点 很 重要 : 同步 
点 ， 就 是 栅栏 本 身 。 当 你 执行 清单 5.12 中 的 write x_then y， 并 且 在 栅栏 操作 之 后 对 Xx 进行 写 
入 ， 就 像 下 面 的 代码 一 样 。 这 里 ， 触 发 断言 的 条 件 就 不 保证 一 定 为 true 了， 尽管 写 入 x 的 操作 
在 写 入 y 的 操作 之 前 发 生 。 


void write_x_then_y() 

{ 
std::atomic_thread_fence(std: :memory_order_release) ; 
x.Sstore(true, std: :memory_order_relaxed); 
y.store(true, std: :memory_order_relaxed) ; 


这 里 里 的 两 个 操作 ， 就 不 会 被 栅栏 分 开 ， 并 且 也 不 再 有 序 。 只 有 当 栅栏 出 现在 存储 X 和 存储 y 
操作 之 间 ， 这 个 顺序 是 硬性 的 。 当 然 ， 栅 栏 是 否 存 在 不 会 影响 任何 拥有 先行 关系 的 执行 序 
列 ， 这 种 情况 是 因为 一 些 其 他 原子 操作 。 


这 个 例子 ， 以 及 本 章 中 的 其 他 例子 ， 变 量 使 用 的 都 是 完整 的 原子 类 型 。 不 过 ， 正 丨 的 好 处 在 
于 ， 使 用 原子 操作 去 执行 一 个 序列 ， 可 以 避免 对 于 一 些 数据 竞争 的 未 定义 行为 ， 可 以 会 看 一 
下 清单 5.2 © 


5.3.6 原子 操作 对 非 原子 的 操作 排序 


当 你 使 用 一 个 普通 的 非 原子 bool 类 型 来 蔡 换 清单 5.12 中 的 x( 就 如 同 你 下 面 看 到 的 代码 )， 行 为 
和 替换 前 完全 一 样 。 


清单 5.13 使 用 非 原子 操作 执行 序列 


#include <atomic> 
#include <thread> 
#include <assert.h> 


bool x=false; // x 现在 是 一 个 非 原子 变量 
std::atomic<bool> y; 
std::atomic<int> z; 


void write_x_then_y() 

{ 
x=true; // 1 在 栅栏 前 存储 x 
std::atomic thread fence(std::memory_order_release); 
y.store(true,std::memory_order_relaxed); // 2 在 栅栏 后 存储 y 


void read_y_then_x() 

{ 
while(!y.load(std::memory_order_relaxed)); // 3 在 #2 写 入 前 ， 持 续 
std::atomic_thread_fence(std: :memory_order_acquire) ; 
if(x) // 4 这 里 读 取 到 的 值 ， 是 #1 中 写 入 


++Z; 


} 
int main() 
{ 
x=false; 
y=false; 
z=0; 
std::thread a(write_x_then_y); 
std::thread b(read_y_then_x); 
a.join(); 
b.join(); 
assert(z.load()!=0); // 5 断言 将 不 会 触发 


栅栏 仍然 为 存储 x@ 和 存储 y@@， 还 有 加 载 y@@ 和 加 载 x 四 提供 一 个 执行 序列 ， 并 且 这 里 仍然 有 一 
个 先行 关系 ， 在 存储 X 和 加 载 X 之 间 ， 所 以 断言 @ 回 不 会 被 甬 发 。@ 中 的 存储 和 国 中 对 y 的 加 载 ， 
都 必须 是 原子 操作 ; 否则 ， 将 会 在 y 上 产生 条 件 竞 争 ， 不 过 一 旦 读 取 线 程 看 到 存储 到 y 的 操 


作 ， 栅 栏 将 会 对 x 执行 有 序 的 操作 。 这 个 执行 顺序 意味 着 ，x 上 不 存在 条 件 竞争 ， 即 使 它 被 另 
外 的 线程 修改 或 被 其 他 线程 读 取 。 


不 仅 是 栅栏 可 对 非 原 子 操作 排序 。 你 在 清单 5.10 中 看 到 
memory_order_release/memory_order_consume 对 ， 也 可 以 用 来 排序 非 原 子 访 问 ， 为 的 是 可 
以 动态 分 配对 象 ， 并 且 本 章 中 的 许多 例子 都 可 以 使 用 普通 的 非 原 子 操作 ， 去 替代 标记 为 
memory_order relaxed 的 操作 。 


对 非 原 子 操 作 的 排序 ， 可 以 通过 使 用 原子 操作 进行 ， 这 里 “前 序 " 作 为 “先行 "的 一 部 分 ， 就 显得 
十 分 重要 了 。 如 果 一 个 非 原 子 操作 是 “ 序 前 "于 一 个 原子 操作 ， 并 且 这 个 原子 操作 需要 "先行 "与 
另 一 个 线程 的 一 个 操作 ， 那 么 这 个 非 原子 操作 也 就 “先行 "于 在 另外 线程 的 那个 操作 了 。 这 一 
序列 操作 ， 就 是 在 清单 5.13 中 对 x 的 操作 ， 并 且 这 也 就 是 清单 5.2 能 工作 的 原因 。 对 于 C++ 标 准 
库 的 高 阶 同步 工具 来 说 ， 这 些 都 是 基本 ， 例 如 互 斥 量 和 条 件 变 量 。 可 以 回 看 它们 都 是 如 何 工 
作 的 ， 可 以 对 清单 5.1 中 简单 的 自 旋 锁 展 开 更 加 深入 的 思考 。 


使 用 std::memory_order_acquire 序列 的 lock() 操 作 是 在 flag.test and _set() 上 的 一 个 循环 ， 并 且 
使 用 std: :memory_order_release 序列 的 unlock() 调 用 flag.clear()。 当 第 一 个 线程 调用 lock() 时 ， 
标志 最 初 是 没有 的 ， 所 以 第 一 次 调用 test_and_set() 将 会 设置 标志 ， 并 且 返 回 false， 表 示 线 程 
现在 已 锁 ， 并 且 结 束 循环 。 之 后 ， 线 程 可 以 自由 的 修改 由 互 斥 量 保护 的 数据 。 这 时 ， 任 何 想 
要 调用 lock() 的 线程 ， 将 会 看 到 已 设置 的 标志 ， 而 后 会 被 test and _set() 中 的 循环 所 阻塞 。 


当 线 程 带 锁 线程 完成 对 保护 数据 的 修改 ， 它 会 调用 unlock()， 相 当 于 调用 带 

有 std::memory_order_release 语义 的 flag.clear()。 这 与 随后 其 他 线程 访问 flag.test_and_set() 
时 调用 lock() 同 步 ( 见 5.3.1 节 )， 这 是 因为 对 lock() 的 调用 带 有 std::memory_order_acquire 语义 。 
为 对 于 保护 数据 的 修改 ， 必 须 先 于 unlock() 的 调用 ， 所 以 修改 “先行 "于 unlock()， 并 且 还 “ 先 
行 " 于 之 后 第 二 个 线程 对 lock() 的 调用 (因为 同步 关系 是 在 Unlock() 和 lock() 中 产生 的 )， 还 “ 先 
行 " 于 当 第 二 个 线程 获取 锁 后 ， 对 保护 数据 的 任何 访问 。 


虽然 ， 其 他 互 斥 量 的 内 部 实现 不 尽 相 同 ， 不 过 基本 原理 都 是 一 样 的 :在 某 一 内 存 位 置 上 ，lock() 
作为 一 个 获取 操作 存在 ， 在 同样 的 位 置 上 unlock() 作 为 一 个 释放 操作 存在 。 


5.4 本 章 总 结 


在 本 章 中 ， 已 经 对 c++ 11 内 存 模型 的 底层 只 是 进行 详尽 的 了 解 ， 并 且 了 解 了 原子 操作 能 在 线 
程 间 提供 基本 的 同步 。 这 里 包含 基本 的 原子 类 型 ， 由 std::atomic<> 类 模板 特 化 后 提供 ; 接 
口 ， 以 及 对 于 这 些 类 型 的 操作 ， 还 要 有 对 内 存 序列 选项 的 各 种 复杂 细节 ， 都 由 原 


始 std::atomic<> 类 模板 提供 。 


我 们 也 了 解 了 栅栏 ， 了 解 其 如 何 让 执行 序列 中 ， 对 原子 类 型 的 操作 同步 成 对 。 最 后 ， 我 们 回 
顾 了 本 章 开始 的 一 些 例子 ， 了 解 了 原子 操作 可 以 在 不 同 线程 上 的 非 原子 操作 间 ， 进 行 有 序 执 
行 。 

在 下 一 章 中 ， 我 们 将 看 到 如 何 使 用 高 阶 同步 工具 ， 以 及 原子 操作 并 发 访问 的 高 效 容器 设计 ， 
还 有 我 们 将 写 一些 并 行 处 理 数据 的 算法 。 


第 6 章 基于 锁 的 并 发 数据 结构 设计 


本 章 主要 内 容 


o 并 发 数据 结构 设计 的 意义 
。 指导 如 何 设计 
© 实现 为 并 发 设计 的 数据 结构 


在 上 一 章 中 ， 我 们 对 底层 原子 操作 和 内 存 模型 有 了 详尽 的 了 解 。 在 本 章 中 ， 我 们 将 先 将 底层 
的 东西 放 在 一 边 (将 会 在 第 7 章 再 次 提 及 )， 来 对 数据 结构 做 一 些 讨论 。 


数据 结构 的 选择 ， 对 于 程序 来 说 ， 是 其 解决 方案 的 重要 组 成 部 分 ， 当 然 ， 并 行程 序 也 不 例 

外 。 如 果 一 种 数据 结构 可 以 被 多 个 线程 所 访问 ， 其 要 不 就 是 绝对 不 变 的 (其 值 不 会 发 生变 化 ， 
并 且 不 需 同步 )， 要 不 程序 就 要 对 数据 结构 进行 正确 的 设计 ， 以 确保 其 能 在 多 线程 环境 下 能 够 
(正确 的 ) 同 步 。 一 种 选择 是 使 用 独立 的 互 太 量 ， 其 可 以 锁 住 需要 保护 的 数据 (这 种 方法 已 经 在 
第 3 和 第 4 章 中 提 到 )， 另 一 种 选择 是 设计 一 种 能 够 并 发 访问 的 数据 结构 。 

在 设计 并 发 数据 结构 时 ， 你 可 以 使 用 基本 多 线程 应 用 中 的 构建 块 (之 前 章节 中 有 提 及 )， 比 如 ， 
互 太 量 和 条 件 变量 。 当 然 ， 你 也 已 经 在 之 前 的 章节 的 例子 中 看 到 ， 怎 样 联合 不 同 的 构建 块 ， 
对 数据 结构 进行 号 入 ， 并 且 保证 这 些 构建 块 都 是 在 并 发 环境 下 是 线程 安全 的 。 

在 本 章 ， 我 们 将 了 解 一 些 并 发 数据 结构 设计 的 基本 准则 。 然 后 ， 我 们 将 再 次 重 温 锁 和 条 件 变 
量 的 基本 构建 块 。 最 后 ， 会 去 了 解 更 为 复杂 的 数据 结构 。 在 第 7 章 ， 我 们 将 了 解 ， 如 何 正确 
的 “ 返 下 归真 "， 并 使 用 第 5 章 提 到 的 原子 操作 ， 去 构建 无 锁 的 数据 结构 。 


好 吧 | 多 说 无 益 ， 让 我 们 来 看 一 下 并 发 数据 结构 的 设计 ， 都 需要 些 什么 。 


6.1 为 并 发 设计 的 意义 何在 ? 


设计 并 发 数据 结构 ， 意 味 着 多 个 线程 可 以 并 发 的 访问 这 个 数据 结构 ， 线 程 可 对 这 个 数据 结构 

做 相同 或 不 同 的 操作 ， 并 且 每 一 个 线程 都 能 在 自己 的 自治 域 中 看 到 该 数据 结构 。 且 在 多 线程 
环境 下 ， 无 数据 丢失 和 损毁 ， 所 有 的 数据 需要 维持 原样 ， 且 无 条 件 竞 争 。 这 样 的 数据 结构 ， 

称 之 为 “线程 安全 ”的 数据 结构 。 通 常情 况 下 ， 当 多 个 线程 对 数据 结构 进行 同一 并 发 操作 是 安全 
的 ， 但 不 同 操作 则 需要 单线 程 独立 访问 数据 结构 。 或 相反 ， 当 线程 执行 不 同 的 操作 时 ， 对 同 

一 数据 结构 的 并 发 操作 是 安全 的 ， 而 多 线程 执行 同样 的 操作 ， 则 会 出 现 问题 。 


实际 的 设计 意义 并 不 止 上 面 提 到 的 那样 : 这 就 意味 着 ， 要 为 线程 提供 并 发 访问 数据 结构 的 机 
会 。 本 质 上 ， 是 使 用 互 斥 量 提供 互 矿 特性 : 在 互 斥 量 的 保护 下 ， 同 一 时 间 内 只 有 一 个 线程 可 
以 获取 互 斥 锁 。 互 斥 量 为 了 保护 数据 ， 显 式 的 阻止 了 线程 对 数据 结构 的 并 发 访问 。 

这 被 称 为 序列 化 (serialzation) : 线程 轮流 访问 被 保护 的 数据 。 这 其 实 是 对 数据 进行 串 行 的 访 
问 ， 而 非 并 发 。 因 此 ， 你 需要 对 数据 结构 的 设计 进行 仔细 类 酌 ， 确 保 其 能 丨 正 并 发 访问 。 虽 
然 ， 一 些 数据 结构 有 着 比 其 他 数据 结构 多 的 并 发 访问 范围 ， 但 是 在 所 有 情况 下 的 思路 都 是 一 
样 的 : 减少 保护 区 域 ， 减 少 序列 化 操作 ， 就 能 提升 并 发 访问 的 潜力 。 


在 我 们 进行 数据 结构 的 设计 之 前 ， 让 我 们 快速 的 浏览 一 下 ， 在 并 发 设计 中 的 指导 建议 。 


6.1.1 数据 结构 并 发 设计 的 指导 与 建议 (指南 ) 


如 之 前 提 到 的 ， 当 设计 并 发 数据 结构 时 ， 有 两 方面 需要 考量 : 一 是 确保 访问 是 安全 的 ， 二 是 
能 丨 正 的 并 发 访问 。 在 第 3 章 的 时 候 ， 已 经 对 如 何 保 证 数据 结构 是 线程 安全 的 做 过 简单 的 描 
ah: 

© 确保 无 线程 能 够 看 到 ， 数 据 结构 的 “不 变量 ?破坏 时 的 状态 。 

。 小 心 那些 会 引起 条 件 竞 争 的 接口 ， 提 供 完整 操作 的 函数 ， 而 非 操作 步骤 。 

© 注意 数据 结构 的 行为 是 否 会 产生 异常 ， 从 而 确保 “不 变量 "的 状态 稳定 。 

o 将 死 锁 的 概率 降 到 最 低 。 使 用 数据 结构 时 ， 需 要 限制 锁 的 范围 ， 且 避免 虞 套 锁 的 存在 。 


在 你 思考 设计 细节 前 ， 你 还 需要 考虑 这 个 数据 结构 对 于 使 用 者 来 说 有 什么 限制 ; 当 一 个 线程 
通过 一 个 特殊 的 函数 对 数据 结构 进行 访问 时 ， 那 么 还 有 哪些 函数 能 被 其 他 的 线程 安全 调用 
呢 ? 


这 是 一 个 很 重要 的 问题 ， 普 通 的 构造 函数 和 析 构 函数 需要 独立 访问 数据 结构 ， 所 以 用 户 在 使 


用 的 时 候 ， 就 不 能 在 构造 函数 完成 前 ， 或 析 构 函数 完成 后 对 数据 结构 进行 访问 。 当 数据 结构 
支持 赋值 操作 ，swap()， 或 拷贝 构造 时 ， 作 为 数据 结构 的 设计 者 ， 即 使 数据 结构 中 有 大 量 的 


函数 被 线程 所 操纵 时 ， 你 也 需要 保证 这 些 操作 在 并 发 环境 下 是 安全 的 (或 确保 这 些 操作 能 够 独 
立 访问 )， 以 保证 并 发 访问 时 不 会 出 现 错误 。 


第 二 个 方面 是 ， 确 保 昌 正 的 并 发 访问 。 这 里 没 法 提供 更 多 的 指导 意见 ; 不 过 ， 作 为 一 个 数据 
结构 的 设计 者 ， 在 设计 数据 结构 时 ， 自 行 考虑 以 下 问题 : 


o 锁 的 范围 中 的 操作 ， 是 否 允 许 在 锁 外 执行 ? 

© 数据 结构 中 不 同 的 区 域 是 否 能 被 不 同 的 互 斥 量 所 保护 ? 

。 所 有 操作 都 需要 同 级 互 斥 量 保护 吗 ? 

o 能 否 对 数据 结构 进行 简单 的 修改 ， 以 增加 并 发 访问 的 概率 ， 且 不 影响 操作 语义 ?了 


这 些 问 题 都 源 于 一 个 指导 思想 : 如 何 让 序列 化 访问 最 小 化 ， 让 真实 并 发 最 大 化 ? 允许 线程 并 
发 读 取 的 数据 结构 并 不 少见 ， 而 对 数据 结构 的 修改 ， 必 须 是 单线 程 独立 访问 。 这 种 结构 ， 类 
WF boost::shared_mutex ° 同样 的 ， 这 多 线程 执行 不 同 的 操 
作 时 ， 并 序列 化 执行 相同 的 操作 的 线 和 (你 很 决 就 和 iy, 





E kk 


最 简单 的 线程 安全 结构 ， 通 常 使 用 的 是 互 斤 量 和 锁 ， 对 数据 进行 保护 。 虽 然 ， 这 么 做 还 是 有 
问题 (如 同 在 第 3 中 提 到 的 那样 ) ， 不 过 这 样 相 对 简单 ， 且 保证 只 有 一 个 线程 在 同一 时 间 对 数 
扣 结 构 进行 一 次 访问 。 为 了 让 你 轻松 的 设计 线程 安全 的 数据 结构 ， 接 下 来 了 解 一 下 基于 锁 的 
数据 结构 ， 以 及 第 7 章 将 提 到 的 无 锁 并 发 数据 结构 的 设计 。 


6.2 基于 锁 的 并 发 数据 结构 


基于 锁 的 并 发 数据 结构 设计 ， 需 要 确保 访问 线程 持 有 和 锁 的 时 间 最 短 。 对 于 只 有 一 个 互 斥 量 的 
数据 结构 来 说 ， 这 十 分 困难 。 需 要 保证 数据 不 被 锁 之 外 的 操作 所 访问 到 ， 并 且 还 要 保证 不 会 
在 固有 结构 上 产生 条 件 竞 争 ( 如 第 3 章 所 述 )。 当 你 使 用 多 个 互 斥 量 来 保护 数据 结构 中 不 同 的 区 
域 时 ， 问 题 会 暴露 的 更 加 明显 ， 当 操作 需要 获取 多 个 互 斥 锁 时 ， 就 有 可 能 产生 死 锁 。 所 以 ， 
在 设计 时 ， 使 用 多 个 互 斥 量 时 需要 格外 小 心 。 


在 本 节 中 ， 你 将 使 用 6.1.1 节 中 的 指导 建议 ， 来 设计 一 些 简 
的 方式 来 保护 数据 。 每 一 个 例子 中 ， 都 是 在 保证 数据 结构 是 线程 安全 的 前 提 下 ， 对 数据 结构 
并 发 访问 的 概率 (机 会 ) 进 行 提高 。 





我 们 先 来 看 看 在 第 3 章 中 栈 的 实现 ， 这 个 实现 就 是 一 个 十 分 简单 的 数据 结构 ， 它 只 使 用 了 一 个 
互 太 量 。 但 是 ， 这 个 结构 是 线程 安全 的 吗 ? C A AERALA SBR? 


6.2.1 线程 安全 栈 一 使 用 锁 
我 们 先 把 第 3 章 中 线程 安全 的 栈 拿 过 来 看 看 : (这 里 试图 实现 一 个 线程 安全 版 的 std:stack<> ) 


清单 6.1 线程 安全 栈 的 类 定义 
#include <exception> 


struct empty_stack: std::exception 
{ 


const char* what() const throw(); 


}; 


template<typename T> 
class threadsafe_stack 
{ 
private: 
std::stack<T> data; 
mutable std::mutex m; 
public: 
threadsafe_stack(){} 
threadsafe_stack(const threadsafe_stack& other) 


{ 


std: :lock_guard<std: :mutex> lock(other.m); 


data=other.data; 


threadsafe_stack& operator=(const threadsafe_stack&) = delete; 


void push(T new_value) 

{ 
std::lock_guard<std: :mutex> lock(m); 
data.push(std: :move(new value)); // 1 

} 

std::shared_ptr<T> pop() 

{ 
std::lock_guard<std: :mutex> lock(m); 
if(data.empty()) throw empty_stack(); // 2 
std::shared_ptr<T> const res( 

std: :make_shared<T>(std::move(data.top()))); //7 3 

data.pop(); // 4 
return res; 

} 

void pop(T& value) 

{ 
std::lock_guard<std: :mutex> lock(m); 
if(data.empty()) throw empty_stack(); 
value=std::move(data.top()); // 5 
data.pop(); // 6 

} 

bool empty() const 

{ 
std::lock_guard<std: :mutex> lock(m); 
return data.empty(); 

} 

}; 


来 看 看 指导 意见 是 如 何 应 用 的 。 


首先 ， 互 斥 量 m 能 保证 基本 的 线程 实 全 ， 那 就 是 对 每 个 成 员 汶 数 进行 加 锁 保护 。 这 就 保证 在 同 
一 时 间 内 ， 只 有 一 个 线程 可 以 访问 到 数据 ， 所 以 能 够 保证 ， 数 据 结构 的 “不 变量 "被 破坏 时 ， 不 
会 被 其 他 线程 看 到 。 


其 次 ， 在 empty() 和 pop() 成 员 哆 数 之 间 会 存在 潜在 的 竞争 ， 不 过 代码 会 在 pop() 坞 数 上 和 锁 时 ， 
显 式 的 查询 栈 是 否 为 室 ， 所 以 这 里 的 竞争 是 非 恶性 的 。pop() 通 过 对 弹出 值 的 直接 返回 ， 就 可 
避免 std::stack<> 中 top() 和 pop() 两 成 员 有 函数 之 间 的 潜在 竞争 。 


再 次 ， 这 个 类 中 也 有 一 些 异 常 源 。 对 互 矿 量 上 锁 可 能 会 抛 出 异常 ， 因 为 上 锁 操 作 是 每 个 成 员 
函数 所 做 的 第 一 个 操作 ， 所 以 这 是 极其 军 见 的 (因为 这 意味 这 问题 不 在 锁 上 ， 就 是 在 系统 资源 
上 )。 因 无 数据 修改 ， 所 以 其 是 安全 的 。 因 解锁 一 个 互 斥 量 是 不 会 失败 的 ， 所 以 段 代码 很 安 
全 ， 并 且 使 用 std::1lock_guard<> 也 能 保证 互 斥 量 上 锁 的 状态 。 


对 data.push()@ 的 调用 可 能 会 抛 出 一 个 异常 ， 不 是 找 贝 /移动 数据 值 时 ， 就 是 内 存 不 足 的 时 
候 。 不 管 是 哪 种 ， std::stack<> 都 能 保证 其 实 安 全 的 ， 所 以 这 里 也 没有 问题 。 


在 第 一 个 重 载 pop() 中 ， 代 码 可 能 会 抛 出 一 个 empty_stack 的 异常 @， 不 过 数据 没有 被 修改 ， 所 
以 其 是 安全 的 。 对 于 res 的 创建 国 ， 也 可 能 会 抛 出 一 个 异常 ， 这 有 两 方面 的 原因 : 

对 std::make_shared 的 调用 ， 可 能 无 法 分 配 出 足够 的 内 存 去 创建 新 的 对 象 ， 并 且 内 部 数据 需 
要 对 新 对 象 进 行 引 用 ; 或 者 ， 在 找 贝 或 移动 构造 到 新 分 配 的 内 存 中 返回 时 抛 出 异常 。 两 种 情 
况 下 ，c++ 运 行 库 和 标准 库 能 确保 这 里 不 会 出 现 内 存 泄露 ， 并 且 新 创建 的 对 象 (如 果 有 的 话 ) 都 
能 被 正确 销毁 。 因 为 没有 对 栈 进行 任何 修改 ， 所 以 这 里 也 不 会 有 问题 。 当 调用 data.pop()@ 
时 ， 其 能 确保 不 抛 出 异常 ， 并 且 返 回 结果 ， 所 以 这 个 重 载 pop() 函 数 " 异 常 -安全 ”。 


第 二 个 重 载 pop() 类 似 ， 除 了 在 捞 贝 赋值 或 移动 赋值 的 时 候 会 抛 出 异常 @ 回 ， 当 构造 一 个 新 对 象 
和 一 个 std: :shared_ptr 实例 时 都 不 会 抛 出 异常 o 同样 ， 在 调用 data.pop()@ (这 个 成 员 H Be 
保证 不 会 抛 出 异常 ) 之 前 ， 依 旧 没 有 对 数据 结构 进行 修改 ， 所 以 这 个 函数 也 为 “异常 -安全 ”。 


最 后 ，empty() 也 不 会 修改 任何 数据 ， 所 以 也 是 “异常 -安全 "函数 。 


当 调 用 持 有 一 个 锁 的 用 户 代码 时 ， 这 里 有 两 个 地 方 可 能 会 产生 死 锁 : 进行 拷贝 构造 或 移动 构 
造 (@，@@) 和 在 对 数据 项 进行 措 贝 赋值 或 移动 赋值 操作 回 的 时 候 ; 还 有 一 个 潜在 死 锁 的 地 方 在 
于 用 户 定义 的 操作 符 hew。 当 这 些 函 数 ， 无 论 是 以 直接 调用 栈 的 成 员 函 数 的 方式 ， 还 是 在 成 员 
函数 进行 操作 时 ， 对 已 经 插入 或 删除 的 数据 进行 操作 的 方式 ， 对 锁 进 行 获取 ， 都 可 能 造成 死 
锁 。 不 过 ， 用 户 要 对 栈 负 责 ， 当 栈 未 对 一 个 数据 进行 拷贝 或 分 配 时 ， 用 户 就 不 能 想当然 的 将 
其 添加 到 栈 中 。 


所 有 成 员 函数 都 使 用 st: :lock_guard<> 来 保护 数据 ， PR VAR 的 成 员 函数 能 有 "线程 安全 "的 表 
现 。 当 然 ， 构 造 与 析 构 函数 不 是 "线程 安全 "的 ， 不 过 这 也 不 成 问题 ， 因 为 对 实例 的 构造 与 析 构 
只 能 有 一 次 。 调 用 一 个 不 完全 构造 对 象 或 是 已 销毁 对 象 的 成 员 函 数 ， 无 论 在 那 种 编程 方式 

下 ， 都 不 可 取 。 所 以 ， 用 户 就 要 保证 在 栈 对 象 完成 构建 前 ， 其 他 线程 无 法 对 其 进行 访问 ; 并 
且 ， 一 定 要 保证 在 栈 对 象 销 毁 后 ， 所 有 线程 都 要 停止 对 其 进行 访问 。 


即使 在 多 线程 情况 下 ， 并 发 的 调用 成 员 有 函数 是 安全 的 (因为 使 用 锁 )， 也 要 保证 在 单线 程 的 情况 
下 ， 数 据 结 构 做 出 正确 反应 。 序 列 化 线程 会 隐 性 的 限制 程序 性 能 ， 这 就 是 栈 争 议 声 最 大 的 地 
方 : 当 一 个 线程 在 等 待 领 时 ， 它 就 会 无 所 事 事 。 同 样 的 ， 对 于 栈 来 说 ， 等 待 添加 元 素 也 是 没 
有 意义 的 ， 所 以 当 一 个 线程 需要 等 待 时 ， 其 会 定期 检查 empty() 或 pop()， 以 及 对 empty_stack 
异常 进行 关注 。 这 样 的 现实 会 限制 栈 的 实现 的 方式 ， 在 线程 等 待 的 时 候 ， 会 浪费 宝贵 的 资源 


去 检查 数据 ， 或 是 要 求 用 户 写 写 外 部 等 待 和 提示 代码 (例如 ， 使 用 条 件 变量 )， ARRARIR 
去 存在 的 意义 这 就 意味 着 资源 的 浪费 。 第 4 章 中 的 队列 ， 就 是 一 种 使 用 条 件 内 部 变量 进行 
等 待 的 数据 结构 ， 接 下 来 我 们 就 来 了 解 一 下 。 


6.2.2 线程 安全 队列 一 使 用 锁 和 条 件 变 量 


第 4 章 中 的 线程 安全 队列 ， 在 清单 6.2 中 重 现 一 下 。 和 使 用 仿 std::stack<> 建立 的 栈 很 像 ， 这 
里 队列 的 建立 也 是 参照 了 std::queue<> 。 不 过 ， 与 标准 容器 的 接口 不 同 ， 我 们 要 设计 的 是 能 
在 多 线程 下 安全 并 发 访问 的 数据 结构 。 


清单 6.2 使 用 条 件 变 量 实 现 的 线程 安全 队列 


template<typename T> 

class threadsafe_queue 

{ 

private: 
mutable std::mutex mut; 
std::queue<T> data_queue; 
std::condition_variable data_cond; 


public: 
threadsafe_queue() 


{} 


void push(T new_value) 

{ 
std::lock_guard<std::mutex> 1k(mut); 
data_queue.push(std: :move(data) ); 
data_cond.notify_one(); // 1 


void wait_and_pop(T& value) // 2 

{ 
std: :unique_lock<std::mutex> lk(mut); 
data_cond.wait(1k, [this]{return !data_queue.empty();}); 
value=std: :move(data_queue.front()); 
data_queue.pop(); 


std::shared_ptr<T> wait_and_pop() // 3 


std: :unique_lock<std::mutex> lk(mut); 
data_cond.wait(lk,[this]{return !data_queue.empty();}); // 


std::shared_ptr<T> res( 

std: :make_shared<T>(std: :move(data_queue.front()))); 
data_queue.pop(); 
return res; 


bool try_pop(T& value) 
{ 
std::lock_guard<std: :mutex> 1k(mut); 
if(data_queue.empty() ) 
return false; 
value=std: :move(data_queue.front()); 
data_queue.pop(); 
return true; 


std::shared_ptr<T> try_pop() 
{ 
std::lock_guard<std: :mutex> 1k(mut); 
if(data_queue.empty() ) 
return std::shared_ptr<T>(); // 5 
std::shared_ptr<T> res( 
std: :make_shared<T>(std: :move(data_queue.front()))); 
data_queue.pop(); 
return res; 


bool empty() const 


{ 
std::lock_guard<std: :mutex> 1k(mut); 
return data_queue.empty(); 


除了 在 push()@ 中 调用 data_cond.notify_one()， 以 及 wait and_pop()@@，6.2 中 对 队列 的 实 
现 与 6.1 中 对 栈 的 实现 十 分 相近 。 两 个 重 载 try_pop() 除 了 在 队列 为 空 时 抛 出 异常 ， 其 他 的 与 6.1 
中 pop() 有 函数 完全 一 样 。 不 同 的 是 ， 在 6.1 中 对 值 的 检索 会 返回 一 个 bool 值 ， 而 在 6.2 中 ， 当 指 
针 指 向 空 值 的 时 候 会 返回 NULL 指 针 回 ， 这 同样 也 是 实现 栈 的 一 个 有 效 途径 。 所 以 ， 即 使 排除 
掉 wait _ and_pop() 辑 数 ， 之 前 对 栈 的 分 析 依 昌 适 用 于 这 里 。 


wiat_and_pop() 辑 数 是 等 待 队 列 向 栈 进行 输入 的 一 个 解决 方案 ; 比 起 持续 调用 empty()， 等 待 
线程 调用 Wait and_pop() 郊 数 和 数据 结构 处 理 等 待 中 的 条 件 变 量 的 方式 要 好 很 多 。 对 于 
data_cond.wait() 的 调用 ， 直 到 队列 中 有 一 个 元 素 的 时 候 ， 才 会 返回 ， 所 以 你 就 不 用 担心 会 出 
现 一 个 空 队 列 的 情况 了 ， 还 有 ， 数 据 会 一 直 被 互 矿 锁 保 护 。 因 为 不 变量 这 里 并 未 发 生变 化 ， 
所 以 函数 不 会 添加 新 的 条 件 竞争 或 是 死 锁 的 可 能 。 


异常 安全 在 这 里 的 会 有 一 些 变化 ， 当 不 止 一 个 线程 等 待 对 队列 进行 推送 操作 是 ， 只 会 有 一 个 
线程 ， 因 得 到 data_cond.notify_one() ;而 继续 工作 着 。 但 是 ， 如 果 这 个 工作 线程 在 

wait and_pop() 中 抛 出 一 个 异常 ， 例 如 : 构造 新 的 std::shared_ptr<> 对 象 图 时 抛 出 异常 ， 那 
么 其 他 线程 则 会 永世 长 眠 。 当 这 种 情况 是 不 可 接受 时 ， 这 里 的 调用 就 需要 改 成 
data_cond.notify_all()， 这 个 函数 将 唤醒 所 有 的 工作 线程 ， 不 过 ， 当 大 多 线程 发 现 队 列 依旧 是 
室 时 ， 又 会 耗费 很 多 资源 让 线程 重新 进入 睡眠 状态 。 第 二 种 替代 方案 是 ， 当 有 异常 抛 出 的 时 
候 ， 让 wait and_pop() 函 数 调 用 notify_one()， 从 而 让 个 另 一 个 线程 可 以 去 尝试 索引 存储 的 
值 。 第 三 种 替代 方案 就 是 将 std: :shared_ptr<> 的 初始 化 过 程 移 到 push() 中 HLF 

储 std::shared_ptr<> 实例 ， 而 非 直接 使 用 数据 的 值 。 将 std::shared_ptr<> 拷贝 到 内 

部 std::queue<> 中 ， 就 不 会 抛 出 异常 了 ， 这 样 wait and_pop() 又 是 安全 的 了 。 下 面 的 程序 清 
单 ， 就 是 根据 第 三 种 方案 进行 修改 的 。 


清单 6.3 持 有 std::shared_ptr<> 实例 的 线程 安全 队列 


template<typename T> 
class threadsafe_queue 


{ 

private: 
mutable std::mutex mut; 
std::queue<std::shared_ptr<T> > data_queue; 
std::condition_variable data_cond; 

public: 


threadsafe_queue() 


{} 


void wait_and_pop(T& value) 

{ 
std: :unique_lock<std::mutex> lk(mut); 
data_cond.wait(1lk, [this]{return !data_queue.empty();}); 
value=std::move(*data_queue.front()); // 1 


data_queue.pop(); 


bool try_pop(T& value) 

{ 
std::lock_guard<std::mutex> 1k(mut); 
if(data_queue.empty() ) 

return false; 

value=std::move(*data_queue.front()); // 2 
data_queue.pop(); 
return true; 


std::shared_ptr<T> wait_and_pop() 

{ 
std: :unique_lock<std::mutex> lk(mut); 
data_cond.wait(1k, [this]{return !data_queue.empty();}); 
std::shared_ptr<T> res=data_queue.front(); // 3 
data_queue.pop(); 
return res; 


std::shared_ptr<T> try_pop() 

{ 
std::lock_guard<std: :mutex> 1k(mut); 
if(data_queue.empty() ) 

return std::shared_ptr<T>(); 

std::shared_ptr<T> res=data_queue.front(); // 4 
data_queue.pop(); 
return res; 


void push(T new_value) 

{ 
std::shared_ptr<T> data( 
std: :make_shared<T>(std::move(new_value))); // 5 
std::lock_guard<std::mutex> 1k(mut); 
data_queue.push(data); 
data_cond.notify_one(); 


bool empty() const 
{ 
std: :lock_guard<std: :mutex> lk(mut); 
return data_queue.empty(); 
} 
J; 


为 让 std::shared_ptr<> 持 有 数据 的 结果 显而易见 : 弹出 函数 会 持 有 一 个 变量 的 引用 ， 为 了 接 
收 这 个 新 值 ， 必 须 对 存储 的 指针 进行 解 引 用 中，@ ; 并 且 ， 在 返回 到 调用 有 函数 前 ， 弹 出 函数 都 
会 返回 一 个 std::shared_ptr<> 实例 ， 这 里 实例 可 以 在 队列 中 做 检索 四 ，@。 


pa 


std::shared_ptr<> 持 有 数据 的 好 处 : 新 的 实例 分 配 结束 时 ， 不 会 被 锁 在 push()@ 当 中 (而 在 清 
单 6.2 中 ， 只 能 在 pop() 持 有 锁 时 完成 )。 因 为 内 存 分 配 操作 的 需要 在 性 能 上 付出 很 高 的 代价 (性 
能 较 低 )， 所 以 使 用 std::shared_ptr<> 的 方式 对 队列 的 性 能 有 很 大 的 提升 ， 其 减少 了 互 斥 量 持 
有 的 时 间 ， 人 允许 其 他 线程 在 分 配 内 存 的 同时 ， 对 队列 进行 其 他 的 操作 。 


如 同 栈 的 例子 ， 使 用 互 斥 量 保护 整个 数据 结构 ， 不 过 会 限制 队列 对 并 发 的 支持 ; 虽然 ， 多 线 
程 可 能 被 队列 中 的 各 种 成 员 部 数 所 阻塞 ， 但 是 仍 有 一 个 线程 能 在 任意 时 间 内 进行 工作 。 不 
过 ， 这 种 限制 的 部 9 了 std::queue<> ; 因为 使 用 标准 容器 的 原因 ， 
数据 处 于 保护 中 。 要 对 数据 结构 实现 进行 具体 的 控制 ， 需 要 提供 更 多 细 粒 度 锁 ， 来 完成 更 高 
级 的 并 发 。 


6.2.3 线程 安全 队列 一 一 使 用 细 粒 度 锁 和 条 件 变量 


在 清单 6.2 和 6.3 中 ， 使 用 一 个 互 斥 量 对 一 个 数据 队列 (data_queue) 进 行 保护 。 为 了 使 用 细 粒 度 
锁 ， 需 要 看 一 下 队列 内 部 的 组 成 结构 ， 并 且 将 一 个 互 不 量 与 每 个 数据 相关 联 。 


对 于 队列 来 说 ， 最 简单 的 数据 结构 就 是 单 链表 了 ， 就 如 图 6.1 那 样 。 队 列 里 包含 一 个 头 指针 ， 
其 指向 链表 中 的 第 一 个 元 素 ， 并 且 每 一 个 元 素 都 会 指向 下 一 个 元 素 。 从 队列 中 删除 数据 ， 其 
实 就 是 将 头 指针 指向 下 一 个 元 素 ， 并 将 之 前 头 指针 指向 的 值 进行 返回 。 


向 队列 中 添加 元 素 是 要 从 结尾 进行 的 。 为 了 做 到 这 点 ， 队 列 里 还 有 一 个 尾 指针 ， 其 指向 链表 
中 的 最 后 一 个 元 素 。 新 节点 的 加 入 将 会 改变 尾 指针 的 next 指 针 ， 之 前 最 后 一 个 元 素 将 会 指向 新 
添加 进来 的 元 素 ， 新 添加 进来 的 元 素 的 next 将 会 使 新 的 尾 指针 。 当 链表 为 空 时 ， 头 / 尾 指 针 沸 
为 NULL。 
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图 6.1 用 单 链表 表示 的 队列 
























































下 面 的 清单 中 的 代码 ， 是 一 个 简单 队列 的 实现 ， 基 于 清单 6.2 代 码 的 精简 版 本 ; 因为 这 个 队列 
(KB BALAK AL > PR VATE RIL PR A — Mry_pop() BA ; 并 且 ， 没 有 wait and_pop() 函 数 。 


清单 6.4 队列 实现 一 一 单线 程 版 


template<typename T> 
class queue 
{ 
private: 
struct node 
{ 
T data; 
std::unique ptr<node> next; 


node(T data_): 
data(std: :move(data_) ) 
{} 

}; 


std::unique_ptr<node> head; // 1 
node* tail; // 2 


public: 
queue( ) 
{} 
queue(const queue& other)=delete; 
queue& operator=(const queue& other )=delete; 
std::shared_ptr<T> try_pop() 


if(!head) 
{ 
return std::shared_ptr<T>(); 
} 
std::shared_ptr<T> const res( 
std: :make_shared<T>(std: :move(head->data) )); 
std::unique_ptr<node> const old_head=std: :move(head); 
head=std: :move(old_head->next); // 3 
return res; 


void push(T new_value) 
if 
std: :unique_ptr<node> p(new node(std: :move(new_value) )); 
node* const new_tail=p.get(); 
if(tail) 
{ 
tail->next=std::move(p); // 4 
} 
else 
{ 
head=std: :move(p); // 5 
} 
tail=new tail; // 6 
} 
}; 


首先 ， 注意 在 清单 呢 6.4 中 使 用 了 std: :unique_ptr<node> 来 管理 节点 ? 因为 其 能 保证 节点 (其 
引用 数据 的 值 ) 在 删除 时 候 ， 不 需要 使 用 delete 操 作 显 式 删除 。 这 样 的 关系 链表 ， 管 理 着 从 头 
结 点 到 尾 节点 的 每 一 个 原始 指针 。 


虽然 ， 这 种 实现 对 于 单线 程 来 说 没什么 问题 ， 但 是 ， 当 你 在 多 线程 情况 下 ， 尝 试 使 用 细 粒 度 
锁 时 ， 就 会 出 现 问题 。 因 为 在 给 定 的 实现 中 有 两 个 数据 项 (head@ 和 tail@) ; 即使 ， 使 用 两 个 
互 不 量 ， 来 保护 头 指 针 和 尾 指 针 ， 也 会 出 现 问 题 。 


显而易见 的 问题 就 是 push() 可 以 同时 修改 头 指 针 回 和 尾 指针 @， 所 以 push() 有 函数 会 同时 获取 两 
SEFE BREGARAI SMP LGM > (LIRR Ke AAA AY A o F848 49 J] RAE push()4e 
pop() 都 能 访问 next 指 针 指 向 的 节点 : push() 可 更 新 tail->next@， 而 后 try_pop() 读 取 read- 
>next@。 当 队列 中 只 有 一 个 元 素 时 ，head==tail ， 所 以 head->next 和 tail->next 是 同一 个 对 


人 
try_pop() 锁 住 的 是 同一 个 锁 ?， 就 不 对 了 。 所 以 ， 你 就 没有 比 之 间 实 现 更 好 的 选择 了 。 这 里 
会 “柳暗花明 又 一 村 ” 吗 ? 


前 过 分 离 数据 实现 并 发 


你 可 以 使 用 * 预 分 配 一 个 虚拟 节点 (无 数据 )， 确 保 这 个 节点 永远 在 队列 的 最 后 ， 用 来 分 离 头 尾 
指针 能 访问 的 节点 "的 办 法 ， 走 出 这 个 困境 。 对 于 一 个 空 队列 来 说 ，head 和 tail 都 属于 虚拟 指 
针 ， 而 非 空 指针 。 这 个 办 法 挺 好 ， 因 为 当 队 列 为 室 时 ，try_pop() 不 能 访问 head->next 了 。 当 
添加 一 个 节点 入 队列 时 (这 时 有 申 实 节点 了 )，head 和 tail 现 在 指向 不 同 的 节点 ， 所 以 就 不 会 在 
head->next 和 tail->next 上 产生 竞争 。 这 里 的 缺点 是 ， 你 必须 额外 添加 一 个 间接 层次 的 指针 数 
据 ， 来 做 虚拟 节点 。 下 面 的 代码 描述 了 这 个 方案 如 何 实现 。 


清单 6.5 带 有 虚拟 节点 的 队列 


template<typename T> 
class queue 


{ 
private: 
struct node 
{ 
std::shared ptr<T> data; // 1 
std: :unique ptr<node> next; 
J; 


std::unique_ptr<node> head; 
node* tail; 


public: 
queue(): 
head(new node),tail(head.get()) // 2 
{} 
queue(const queue& other)=delete; 
queue& operator=(const queue& other )=delete; 


std::shared_ptr<T> try_pop() 


{ 
if(head.get()==tail) // 3 
{ 
return std::shared_ptr<T>(); 
} 


std::shared_ptr<T> const res(head->data); // 4 


std: :unique_ptr<node> old_head=std::move(head); 
head=std: :move(old head->next); //5 
return res; // 6 


void push(T new_value) 

{ 
std::shared_ptr<T> new_data( 

std::make_shared<T>(std::move(new_value))); // 7 

std::unique_ptr<node> p(new node); //8 
tail->data=new_data; // 9 
node* const new_tail=p.get(); 
tail->next=std::move(p); 
tail=new_tail; 

} 

}; 


try_pop() 不 需要 太 多 的 修改 。 首 先 ， 你 可 以 拿 head 和 tail@ 进 行 比 较 ， 这 就 要 比 检查 指针 是 否 
为 空 的 好 ， 因 为 庶 拟 节点 意味 着 head 不 可 能 是 空 指针 。head 是 一 个 std::unique_ptr<node> 对 
象 ， 你 需要 使 用 head.get() 来 做 比较 。 其 次 ， 因 为 node 现 在 存在 数据 指针 中 四 ， 你 就 可 以 对 指 
针 进行 直接 检索 @， 而 非 构 造 一 个 T 类 型 的 新 实例 。push() 函 数 改 动 最 大 : 首先 ， 你 必须 在 扒 
上 创建 一 个 T 类 型 的 实例 ， 并 且 让 其 与 一 个 std::shared_ptr<> 对 象 相 关联 @( 节 点 使 

用 std::make_shared 就 是 为 了 避免 内 存 二 次 分 配 ， 避 免 增 加 引用 次 数 )。 创 建 的 新 节点 就 成 为 
了 虚拟 节点 ， 所 以 你 不 需要 为 new_value 提 供 构 造 函 数 回 。 反 而 这 里 你 需要 将 new_value 的 副 
本 赋 给 之 前 的 虚拟 节点 回 。 最 终 ， 为 了 让 虚拟 节点 存在 在 队列 中 ， 你 不 得 不 使 用 构造 函数 来 创 
建 它 @。 


那么 现在 ， 我 确信 你 会 对 如 何 对 如 何 修改 队列 ， 让 其 变 成 一 个 线程 安全 的 队列 感到 惊讶 。 好 
吧 ， 现 在 的 push() 只 能 访问 tail， 而 不 能 访问 head， 这 就 是 一 个 进步 try_pop() 可 以 访问 head 和 
tail， 但 是 tail 只 需 在 最 初 进行 比较 ， 所 以 所 存在 的 时 间 很 短 。 重 大 的 提升 在 于 ， 庶 拟 节 点 意 " 
着 try_pop() 和 push() 不 能 对 同一 节点 进行 操作 ， 所 以 这 里 已 经 不 再 需要 互 斥 了 。 那 么 ， 你 只 需 
要 使 用 一 个 互 斥 量 来 保护 head 和 tail 就 够 了 。 那 么 ， 现 在 应 该 锁 哪 里 ? 


我 们 的 目的 是 为 了 最 大 程度 的 并 发 化 ， 所 以 你 需要 上 锁 的 时 间 ， 要 尽 可 能 的 小 。push() 很 简 
单 : 互 矿 量 需 要 对 tail 的 访问 进行 上 锁 ， 这 就 意味 着 你 需要 对 每 一 个 新 分 配 的 节点 进行 上 锁 

> 还 有 在 你 对 当前 尾 节 点 进行 赋值 的 时 候 回 也 需要 上 锁 。 锁 需要 持续 到 函数 结束 时 才能 解 
开 o 

try_pop() 就 不 简单 了 。 首 先 ， 你 需要 使 用 互 斥 量 锁 住 head， 一 直到 head 弹 出 。 实 际 上 ， 互 斥 
量 决定 了 哪 一 个 线程 来 进行 弹出 操作 。 一 旦 head 被 改变 @ 回 ， 你 才能 解锁 互 斥 量 ; 当 在 返回 结 
果 时 ， 互 斥 量 就 不 需要 进行 上 锁 了 @。 这 使 得 访问 tail 需 要 一 个 尾 互 斥 量 。 因 为 ， 你 需要 只 需 


要 访问 tail 一 次 ， 且 只 有 在 访问 时 才 需 要 互 斥 量 。 这 个 操作 最 好 是 通过 函数 进行 包装 。 事 
上 ， 因 为 代码 只 有 在 成 员 需 要 head 时 ， 互 斥 量 才 上 锁 ， 这 项 也 需要 包含 在 包 
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代码 如 下 所 示 。 


清单 6.6 线程 安全 队列 


细 粒 度 锁 版 





template<typename T> 


class threadsafe_queue 


{ 


private: 


struct node 


{ 


Fi 


std::shared_ptr<T> data; 
std: :unique_ptr<node> next; 


std::mutex head_mutex; 


std::unique_ptr<node> head; 


std::mutex tail_mutex; 


node* tail; 


node* get_tail() 


£ 


std::lock_guard<std::mutex> tail_lock(tail_mutex); 
return tail; 


std::unique_ptr<node> pop_head() 


€ 


} 


std::lock guard<std: :mutex> head_lock(head mutex); 
if(head.get()==get_tail()) 
{ 
return nullptr; 
} 
std: :unique_ptr<node> old_head=std::move(head); 
head=std: :move(old_head->next); 
return old_head; 


public: 


threadsafe_queue(): 
head(new node),tail(head.get()) 


{} 


threadsafe_queue(const threadsafe_queue& other )=delete; 
threadsafe_queue& operator=(const threadsafe_queue& 
other )=delete; 


std::shared_ptr<T> try_pop() 
{ 
std: :unique_ptr<node> old_head=pop_head(); 
return old_head?old_head->data:std::shared_ptr<T>(); 


void push(T new_value) 

{ 
std::shared_ptr<T> new_data( 

std::make_shared<T>(std: :move(new_value))); 

std: :unique_ptr<node> p(new node); 
node* const new_tail=p.get(); 
std::lock_guard<std::mutex> tail_lock(tail_mutex); 
tail->data=new_data; 
tail->next=std::move(p); 
tail=new_tail; 

} 

}; 


让 我 们 用 挑 别 的 目光 来 看 一 下 上 面 的 代码 ， 并 考虑 6.1.1 节 中 给 出 的 指导 意见 。 在 你 观察 不 变 
量 前 ， 你 需要 确定 的 状态 有 : 
e tail->next == nullptr 


e tail->data == nullptr 


head == taill( 意 味 着 空 列 表 ) 


单元 素 列 表 head->next = tail 


在 列表 中 的 每 一 个 节点 x，x!=tail 且 x->data 指 向 一 个 T 类 型 的 实例 ， 并 且 x->next 指 向 列表 
中 下 一 个 节点 。x->next == tail 意 味 着 x 就 是 列表 中 最 后 一 个 节点 


e 顺 着 head 的 next 节 点 找 下 去 ， 最 终 会 找到 tail 


这 里 的 push() 很 简单 : 仅 修改 了 被 tail_mutex 的 数据 ， 因 为 新 的 尾 节点 是 一 个 空 节 点 ， 并 且 其 
data 和 next 都 为 日 的 尾 节点 (实际 上 的 尾 节点 ) 设 置 好 ， 所 以 其 能 维持 不 变量 的 状态 。 


有 趣 的 部 分 在 于 try_pop() 上 。 事 实证 明 ， 不 仅 需 要 对 tail_mutex 上 锁 ， 来 保护 对 tail 的 读 取 ; 还 
要 保证 在 从 头 读 取 数 据 时 ， 不 会 产生 数据 竞争 。 如 果 没 有 这 些 互 斥 量 ， 当 一 个 线程 调用 
try_pop() 的 同时 ， 另 一 个 线程 调用 push()， 那 么 这 里 操作 顺序 将 不 可 预测 。 尽 管 ， 每 一 个 成 员 
函数 都 持 有 一 个 互 斥 量 ， 这 些 互 矿 量 能 保护 数据 不 会 同时 被 多 个 线程 访 问 到 ; 并 且 ， 队 列 中 
的 所 有 数据 来 源 ， 都 是 通过 调用 push() 得 到 的 。 因 为 线程 可 能 会 无 序 的 方位 同一 数据 ， 所 以 这 
里 就 会 有 数据 竞争 (正如 你 在 第 5 章 看 到 的 那样 )， 以 及 未 定义 行为 。 幸 运 的 是 ， 在 get_ tail() 
的 tail_mutex 解 决 了 所 有 的 问题 。 因 为 调用 get tail() 将 会 锁 住 同名 锁 ， 就 像 push() 一 样 ， 这 就 
为 两 个 操作 规定 好 了 顺序 。 要 不 就 是 get Ral? push 前 被 调用 ， 这 种 情况 下 ， 线 程 可 以 看 
到 旧 的 尾 闻 点 ， 要 不 就 是 在 push() 之 后 完成 ， 这 种 情况 下 ， 线 程 就 能 看 到 tail 的 新 值 ， 以 及 新 
数据 前 的 丨 正 tail 的 值 。 


当 get_tail() 调 用 前 ，head_mutex 已 经 上 锁 ， 这 一 步 也 是 很 重要 的 哦 。 如 果 不 这 样 ， 调 用 
pop_head() 时 就 会 被 get_tail() 和 head_mutex 所 卡 住 ， 因 为 其 他 线程 调用 try_pop()( 以 及 
pop_head()) 时 ， 都 需要 先 获取 锁 ， 然 后 阻止 从 下 面 的 过 程 中 初始 化 线程 : 


std: :unique_ptr<node> pop_head() // 这 是 个 有 缺陷 的 实现 
{ 

node* const old_tail=get_tail(); // @ 在 head _mutex 范 围 外 获取 旧 
尾 节 点 的 值 

std::lock_guard<std: :mutex> head_lock(head_mutex); 


if(head.get()==old_tail) // © 
{ 
return nullptr; 
} 
std::unique_ptr<node> old_head=std: :move(head); 
head=std: :move(old_head->next); // © 
return old_head; 


这 是 一 个 有 缺陷 的 实现 ， 调 用 get tail() 是 在 锁 的 范围 之 外 ， 你 可 能 也 许 会 发 现 head 和 tail， 在 
你 初始 化 线程 ， 并 获取 head_mutex 时 ， 发 生 了 改变 。 并 且 ， 不 只 是 返回 尾 节 点 时 ， 返 回 的 不 
是 尾 节点 了 ， 其 值 甚 至 都 不 列表 中 的 值 了 。 即 使 head 是 最 后 一 个 节点 ， 这 也 意味 着 head 和 
old tail@ 比 较 失 败 。 因 此 ， 当 你 更 新 head@ 时 ， 可 能 会 将 head 移 到 tail 之 后 ， 这 样 的 话 就 意味 
着 数据 结构 遭 到 了 破坏 。 在 正确 实现 中 (清单 6.6)， 需 要 保证 在 head_mutex 保 护 的 范围 内 调用 
tail()。 这 就 能 保证 没有 其 他 线程 能 对 head 进 行 修改 ， 并 且 tail 会 向 正确 的 方向 移动 ( 当 有 新 

点 添加 进来 时 )， 这 样 就 很 安全 了 。head 不 会 传递 给 get_tail() 的 返回 值 ， 所 以 不 变量 的 状态 
ae o 


当 使 用 pop_head() 更 新 head 时 (从 队列 中 删除 节点 )， 互 不 量 就 已 经 上 锁 了 ， 并 且 try_pop() 可 
以 提取 数据 ， 并 在 确实 有 个 数据 的 时 候 删 除 一 个 节点 ( 若 没 有 数据 ， 则 返 

回 std::shared_ptr<> 的 空 实例 )， 因 为 只 有 一 个 线程 可 以 访问 这 个 节点 ， 所 以 根据 我 们 所 掌握 
的 知识 ， 认 为 这 个 操作 是 安全 的 。 


接 下 来 ， 外 部 接口 就 相当 于 清单 6.2 代 码 中 的 子 集 了 ， 所 以 同样 的 分 析 结 果 : 对 于 固有 接口 来 
说 ， 不 存在 条 件 竞争 。 


出 常 是 很 有 趣 的 东西 。 虽 然 ， 你 已 经 改变 了 数据 的 分 配 模 式 ， 但 是 异常 可 能 从 别 的 地 方 歼 

来 。try_pop() 中 的 对 锁 的 操作 会 产生 弄 溃 ， 并 直到 锁 获 取 才 能 对 数据 进行 修改 。 因 此 ， 
try_pop() 是 异常 安全 的 。 另 一 方面 ，push() 可 以 在 堆 上 新 分 配 出 一 个 T 的 实例 ， 以 及 一 个 node 
的 新 实例 ， 这 里 可 能 会 抛 出 异 浸 。 但 是 ， 所 有 分 配 的 对 象 都 赋 给 了 智能 指针 ， 那 么 当 弄 常 发 
=o ， 就 会 被 释放 掉 。 一 旦 锁 被 获取 ，push() 中 的 操作 就 不 会 抛 出 异常 ， 所 以 push() 也 是 
异常 


因为 a ， 所 以 不 会 死 锁 。 在 实现 内 部 也 不 会 有 死 锁 ; 唯一 需要 获取 两 个 锁 的 
是 pop_head()， 这 个 函数 需要 获取 head_mutex 和 tail_mutex， 所 以 不 会 产生 死 锁 。 


那么 剩 下 的 问题 就 都 在 实际 并 发 的 可 行 性 上 了 。 这 个 结构 对 并 发 访问 的 考虑 要 多 于 清单 6.2 中 
的 代码 ， 因 为 这 里 锁 粒 度 更 加 的 小 ， 并 且 更 多 的 数据 不 在 锁 的 保护 范围 内 。 比 如 ， 在 push() 
中 ， 新 节点 和 新 数据 的 分 配 都 不 需要 锁 来 保护 。 这 就 意味 着 多 线程 情况 下 ， 节 点 及 数据 的 分 
配 是 “安全 ”并 发 的 。 同 一 时 间 内 ， 只 有 一 个 线程 可 以 将 它 的 节点 和 数据 添加 到 队列 中 ， 所 以 代 
码 中 只 是 简单 使 用 了 指针 赋值 的 形式 ， 相 较 于 基于 std::queue<> 的 实现 中 ， 对 

于 std: :queue<> 的 内 部 操作 进行 上 锁 ， 这 个 结构 中 就 不 需要 了 。 


同样 ，try_pop() 持 有 tail_mutex 也 只 有 很 短 的 时 间 ， 只 为 保护 对 tail 的 读 取 。 因 此 ， 当 有 数据 
push 进 队列 后 ，try_pop() 几 乎 及 可 以 完全 并 发 调用 了 。 同 样 在 执行 中 ， 对 head _mutex 的 持 有 
时 间 也 是 极 短 的 。 当 并 发 访问 时 ， P 增加 对 try_pop() 的 访问 次 数 ; 且 只 有 一 个 线程 ， 在 
同一 时 间 内 可 以 访问 pop_head()， 且 多 线程 情况 下 可 以 删除 队列 中 的 旧 节 点 ， 并 且 安 全 的 返 
回 数据 。 


等 待 数据 弹出 


OK， 所 以 清单 6.6 提 供 了 一 个 使 用 细 粒 度 锁 的 线程 安全 队列 ， 不 过 只 有 try_pop() 可 以 并 发 访问 
( 且 只 有 一 个 重 载 存 在 )。 那 么 在 清单 6.2 中 方便 的 wait and_pop() 呢 ?你 能 通过 细 粒 度 锁 实现 
一 个 相同 功能 的 接口 吗 ? 


当然 ， 答 案 是 “是 的 "， 不 过 的 确 有 些 困难 ， 困 难 在 哪里 ?修改 push() 是 相对 简单 的 : 只 需要 在 
函数 体 末 尾 添 加 data_cond.notify_ont() 辑 数 的 调用 即 可 (如 同 清单 6.2 中 那样 )。 当然， 事实 并 
没有 那么 简单 : 你 使 用 细 粒 度 锁 ， 是 为 了 保证 最 大 程度 的 并 发 。 当 将 互 斥 量 和 notify_one() 混 
用 的 时 ， 如 果 被 通知 的 线程 在 互 乒 量 解锁 后 被 唤醒 ， 那 么 这 个 线程 就 不 得 不 等 待 互 斥 量 上 
锁 。 另 一 方面 ， Tare eee My One) T A ， 那么 互 斤 量 可 能 会 等 待 线 程 醒 来 ， 来 获 
取 互 斥 锁 (假设 没有 其 他 线程 对 互 斥 量 上 锁 ) 。 这 可 能 是 一 个 微小 的 改动 ， 但 是 对 于 一 些 情况 来 
说 ， 就 显 的 很 重要 了 。 


wait and_pop() 就 有 些 复杂 了 ， 因 为 需要 确定 在 哪里 等 待 ， 也 就 是 函数 在 哪里 执行 ， 并 且 需 要 
确定 哪些 互 太 量 需 要 上 锁 。 等 待 的 条 件 是 “队列 非 空 "， 这 就 意味 着 headl=tail。 这 样 写 的 话 ， 
就 需要 同时 获取 head_mutex 和 tail_mutex， 并 对 其 进行 上 锁 ， 不 过 在 清单 6.6 中 已 经 使 用 
tail_mutex 来 保护 对 tail 的 读 取 ， 以 及 不 用 和 自身 记性 比较 ， 所 以 这 种 逻辑 也 同样 适用 于 这 里 。 
如 果 有 函数 让 head!=get tail()， 你 只 需要 持 有 head_mutex， 然 后 你 就 可 以 使 用 锁 ， 对 
data_cond.wait() 的 调用 进行 保护 。 当 你 将 等 待 远 辑 添加 入 结构 当中 ， 那 么 实现 的 方式 与 
try_pop() 基 本 上 是 一 样 的 。 


对 于 try_pop(0) 和 wait and_pop() 的 重 载 都 需要 深思 熟 虑 。 当 你 将 返回 std::shared_ptr<> 替换 
为 从 “old_head 后 索引 出 的 值 ， 并 且 找 贝 赋值 给 value 参 数 " 进 行 返 回 时 ， 那 么 这 里 将 会 存在 异 
常安 全 问题 。 数 据 项 在 互 斥 锁 未 上 锁 的 情况 下 被 删除 ， 将 剩 下 的 数据 返回 给 调用 者 。 不 过 ， 
当 拷 贝 赋值 抛 出 异常 (可 能 性 很 大 ) 时 ， 数 据 项 将 会 丢失 ， 因 为 它 没 有 被 返回 队列 原来 的 位 置 
Ło 


当下 类 型 有 无 异常 抛 出 的 移动 赋值 操作 ， 或 无 异常 抛 出 的 交换 操作 时 ， 你 可 以 使 用 它 ， 不 过 ， 
你 肯定 更 喜欢 一 种 通用 的 解决 方案 ， 无 论 T 是 什么 类 型 ， 这 个 方案 都 能 使 用 。 在 这 种 情况 下 ， 
在 节点 从 列表 中 删除 前 ， 你 就 不 得 不 将 有 可 能 抛 出 异常 的 代码 ， 放 在 锁 保 护 的 范围 内 ， 来 保 
证 异常 安全 性 。 这 也 就 意味 着 你 需要 对 pop_head() 进 行 重 载 ， 查 找 索引 值 在 列表 改动 前 的 位 
Zo 


相 比 之 下 ，empty() 就 更 加 的 简单 :只 需要 锁 住 head_mutex， 并 且 检 查 head==get tail()( 详 见 清 
单 6.10) 就 可 以 了 。 最 终 的 代码 ， 在 清单 6.7，6.8，6.9 和 6.10 中 。 


清单 6.7 可 上 和 锁 和 等 待 的 线程 安全 队列 一 一 内 部 机 构 及 接口 


template<typename T> 
class threadsafe_queue 


{ 
private: 
struct node 
{ 
std::shared_ptr<T> data; 
std: :unique_ptr<node> next; 
}; 


std::mutex head_mutex; 

std::unique_ptr<node> head; 

std::mutex tail_mutex; 

node* tail; 

std::condition_variable data_cond; 
public: 

threadsafe_queue(): 

head(new node), tail(head.get()) 

{} 

threadsafe_queue(const threadsafe_queue& other )=delete; 

threadsafe_queue& operator=(const threadsafe_queue& 
other )=delete; 


std::shared_ptr<T> try_pop(); 

bool try_pop(T& value); 
std::shared_ptr<T> wait_and_pop(); 
void wait_and_pop(T& value); 

void push(T new_value); 

bool empty(); 


ia, 


向 队列 中 添加 新 节点 是 相当 简单 的 一 一 下 面 的 实现 与 上 面 的 代码 差不多 。 


清单 6.8 可 上 和 锁 和 等 待 的 线程 安全 队列 一 一 推 入 新 节点 


template<typename T> 
void threadsafe_queue<T>: :push(T new_value) 
{ 
std::shared_ptr<T> new_data( 
std: :make_shared<T>(std: :move(new_value) )); 
std::unique_ptr<node> p(new node); 
{ 
std: :lock_guard<std: :mutex> tail_lock(tail_mutex); 
tail->data=new_data; 
node* const new_tail=p.get(); 
tail->next=std::move(p); 
tail=new_tail; 
} 


data_cond.notify_one(); 


如 同 之 前 所 提 到 的 ， 复 杂 部 分 都 在 pop 那 边 ， 所 以 提供 帮助 性 函数 去 简化 这 部 分 就 很 重要 了 。 
下 一 个 清单 中 将 展示 wait_and_pop() 的 实现 ， 以 及 先 关 的 帮助 函数 。 


清单 6.9 可 上 和 锁 和 等 待 的 线程 安全 队列 一 一 wait_and_pop() 


template<typename T> 
class threadsafe_queue 
{ 
private: 
node* get_tail() 
{ 
std::lock_guard<std: :mutex> tail_lock(tail_mutex); 
return tail; 


std::unique_ptr<node> pop_head() // 1 

{ 
std: :unique_ptr<node> old_head=std::move(head) ; 
head=std: :move(old_head->next); 
return old_head; 


std::unique_lock<std::mutex> wait_for_data() // 2 


{ 


std: :unique_lock<std: :mutex> head_ lock(head mutex ) ; 

data_cond.wait(head_lock, [&]{return 
head.get()!=get_tail();}); 

return std::move(head_lock); // 3 


std::unique_ptr<node> wait_pop_head() 


{ 
std: :unique_lock<std::mutex> head_lock(wait_for_data()); // 


return pop_head(); 


std: :unique_ptr<node> wait_pop_head(T& value) 


{ 
std: :unique_ lock<std: :mutex> head_lock(wait_for_data()); // 


value=std: :move(*head->data) ; 
return pop_head(); 

} 

public: 

std::shared_ptr<T> wait_and_pop() 

{ 
std: :unique_ptr<node> const old_head=wait_pop_head(); 
return old_head->data; 


void wait_and_pop(T& value) 
{ 
std: :unique_ptr<node> const old_head=wait_pop_head(value); 
} 
J; 


A a ene epee heady? 
和 wait for data()@， 这 些 函 数 分 别 是 删除 头 结 点 和 等 待 队列 中 有 数据 弹出 的 。 
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它 还 会 将 锁 的 实例 返回 给 调用 者 @@。 这 就 需要 确保 同一 个 锁 在 执行 与 Wait_pop_head() 重 载 
@@@ 的 相关 操作 时 ， 已 持 有 锁 。pop_head() 是 对 try_pop() 代 码 的 复 用 ， 将 在 下 面 进行 展示 : 


清单 6.10 可 上 锁 和 等 待 的 线程 安全 队列 一 一 try_pop() 和 empty() 


template<typename T> 
class threadsafe_queue 
{ 
private: 
std::unique_ptr<node> try_pop_head() 
{ 
std::lock_guard<std::mutex> head_lock(head_mutex); 
if(head.get()==get_tail()) 


{ 

return std::unique_ptr<node>(); 
} 
return pop_head(); 


std::unique_ptr<node> try_pop_head(T& value) 

{ 
std::lock_guard<std::mutex> head_lock(head_mutex); 
if(head.get()==get_tail()) 
{ 

return std::unique_ptr<node>(); 

} 
value=std: :move(*head->data); 
return pop_head(); 

} 

public: 

std::shared_ptr<T> try_pop() 

{ 
std::unique ptr<node> old_head=try_pop_head(); 
return old_head?old_head->data:std::shared_ptr<T>(); 


bool try_pop(T& value) 
{ 


std: :unique_ptr<node> const old_head=try_pop_head(value); 
return old_head; 


bool empty() 
{ 


std::lock_guard<std::mutex> head_lock(head_mutex); 


return (head.get()==get_tail()); 
} 
}; 


这 个 队列 的 实现 将 作为 第 7 章 无 锁 队 列 的 基础 。 这 是 一 个 无 界 队 列 ; 线 程 可 以 持续 向 队列 中 添加 
数据 项 ， 即 使 没有 元 素 被 删除 。 与 之 相反 的 就 是 有 界 队 列 ， 在 有 界 队 列 中 ， 队 列 在 创建 的 时 
候 最 大 长 度 就 已 经 是 固定 的 了 。 当 有 界 队 列 满载 时 ， 尝 试 在 向 其 添加 元 素 的 操作 将 会 失败 或 
者 阻塞 ， 直 到 有 元 素 从 队列 中 弹出 。 在 任务 执行 时 ( 详 见 第 8 章 )， 有 界 队 列 对 于 线程 间 的 工作 
花费 是 很 有 帮助 的 。 其 会 阻止 线程 对 队列 进行 填充 ， 并 且 可 以 避免 线程 从 较 远 的 地 方 对 数据 
项 进行 索引 。 


无 界 队 列 的 实现 ， 很 容易 扩展 成 ， 可 在 push() 中 等 待 跳 进 变量 的 定 长 队列 。 相 对 于 等 待 队 列 中 
具有 数据 项 (pop() 执 行 完 成 后 )， 你 就 需要 等 待 队 列 中 数据 项 小 于 最 大 值 就 可 以 了 。 对 于 有 界 
队列 更 多 的 讨论 ， 已 经 超出 了 本 书 的 范围 ， 就 不 再 多 说 ; 现在 越过 队列 ， 向 更 加 复杂 的 数据 
结构 进发 。 


6.3 基于 锁 设 计 更 加 复杂 的 数据 结构 


栈 和 队列 都 很 简单 : 接口 相对 固定， 并且 它们 应 用 于 比较 特殊 的 情况 。 并 不 是 所 有 数据 结构 
都 像 它 们 一 样 简单 ; 大 多 数 数据 结构 支持 更 加 多 样 化 的 操作 。 原 则 上 ， 这 将 增 大 并 行 的 可 能 
性 ， 但 是 也 让 对 数据 保护 变 得 更 加 困难 ， 因 为 要 考虑 对 所 有 能 访问 到 的 部 分 。 当 为 了 并 发 访 
问 对 数据 结构 进行 设计 时 ， 这 一 系列 原 有 的 操作 ， 就 变 得 越发 重要 ， 需 要 重点 处 理 。 


先 来 看 看 ， 在 查询 表 的 设计 中 ， 所 遇 到 的 一 些 问题 。 


6.3.1 编写 一 个 使 用 锁 的 线程 安全 和 查询 表 


查询 表 或 字典 是 一 种 类 型 的 值 ( 键 值 ) 和 另 一 种 类 型 的 值 进行 关联 (映射 的 方式 )。 一 般 情 况 下 ， 
这 样 的 结构 允许 代码 通过 键 值 对 相关 的 数据 值 进 行 查询 。 在 cr+ 标准 库 中 ， 这 种 相关 工具 
有 > std::map<> , std::multimap<> , std::unordered_map<> 以 


及 std: :unordered_multimap<> ° 


查询 表 的 使 用 与 栈 和 队列 不 同 。 栈 和 队列 上 ， 几 乎 每 个 操作 都 会 对 数据 结构 进行 修改 ， 不 是 
添加 一 个 元 素 ， 就 是 删除 一 个 ， 而 对 于 查询 表 来 说 ， 几 乎 不 需要 什么 修改 。 清 单 3.13 中 有 个 
例子 ， 是 一 个 简单 的 域名 系统 (DNS) 缓 存 ， 其 特点 是 ， 相 较 于 sta: :map<> Ñ 减 了 很 多 的 接 
口 。 和 队列 和 栈 一 样 ， 标 准 容器 的 接口 不 适合 多 线程 进行 并 发 访问 ， 因 为 这 些 接 口 在 设计 的 
时 候 都 存在 固有 的 条 件 竞争 ， 所 以 这 些 接 口 需要 砍 掉 ， 以 及 重新 修订 。 


并 发 访问 时 ， std::map<> 接口 最 大 的 问题 在 于 一 一 迭代 器 。 虽 然 ， 在 多 线程 访问 (或 修改 ) 容 
器 时 ， 可 能 会 有 提供 安全 访问 的 闪 代 器 ， 但 这 就 问题 环 手 之 处 。 要 想 正 确 的 处 理 闪 代 器 ， 你 
可 能 会 碰 到 下 面 这 个 问题 : 当 和 迭代 器 引用 的 元 素 被 其 他 线程 删除 时 ， 和 迭代 器 在 这 里 就 是 个 问 
题 了 。 线 程 安全 的 查询 表 ， 第 一 次 接口 前 减 ， 需 要 绕 过 迭代 器 。 std: :map<> (以 及 标 准 库 中 其 
他 相关 容器 ) 给 定 的 接口 对 于 和 迭代 器 的 依赖 是 很 严重 的 ， 其 中 有 些 接口 需要 先 放 在 一 边 ， 先 对 
一 些 简单 接口 进行 设计 。 
查询 表 的 基本 操作 有 : 

o 添加 一 对 “ 键 值 -数据 ” 

o 修改 指定 键 值 所 对 应 的 数据 

e 删除 一 组 值 


。 通过 给 定 键 值 ， 获 取 对 应 数据 


容器 也 有 一 些 操作 是 非常 有 用 的 ， 比 如 : 查询 容器 是 否 为 室 ， 键 值 列表 的 完整 快照 和 "“ 键 值 - 数 
据 "的 完整 快照 。 


如 果 你 坚持 之 前 的 线程 安全 指导 意见 ， 例 如 : 不 要 返回 一 个 引用 ， 并 且 用 一 个 简单 的 互 斥 锁 
对 每 一 个 成 员 函 数 进行 上 锁 ， 以 确保 每 一 个 函数 线程 安全 。 最 有 可 能 的 条 件 竞争 在 于 ， 当 一 
对 “ 键 值 -数据 "加 入 时 ; 当 两 个 线程 都 添加 一 个 数据 ， 那 么 肯定 一 个 先 一 个 后 。 一 种 方式 是 合 
并 “添加 ”和 "修改" 操作， 为 一 个 成 员 函 数 ， 就 像 清 单 3.13 对 域名 系统 缓存 所 做 的 那样 。 


从 接口 角度 看 ， 有 一 个 问题 很 是 有 趣 ， 那 就 是 任意 (if any) 部 分 获取 相关 数据 。 一 种 选择 是 允 
许 用 户 提供 一 个 “默认 ” 值 ， 在 键 值 没 有 对 应 值 的 时 候 进 行 返回 : 


mapped _ type get_value(key_type const& key, mapped_type 
default_value); 


在 种 情况 下 ， 当 default_ value 没有 明确 的 给 出 时 ， 默 认 构造 出 的 mapped _ type 实例 将 被 使 

用 。 也 可 以 扩展 成 返回 一 个 std: :pair<mapped_type, bool> 来 代替 mapped _ type 实例 ， 其 中 
bool 代 表 返 回 值 是 否 是 当前 键 对 应 的 值 。 另 一 个 选择 是 ， 返 回 一 个 有 指向 数据 的 智能 指针 ; 当 
指针 的 值 是 NULL 时 ， 那 么 这 个 键 值 就 没有 对 应 的 数据 。 


如 我 们 之 前 所 提 到 的 ， 当 接口 确定 时 ， 那 么 (假设 没有 接口 间 的 条 件 竞争 ) 就 需要 保证 线程 安全 
了 ， 可 以 通过 对 每 一 个 成 员 函 数 使 用 一 个 互 斥 量 和 一 个 简单 的 锁 ， 来 保护 底层 数据 。 不 过 ， 
当 独 立 的 函数 对 数据 结构 进行 读 取 和 修改 时 ， 就 会 降低 并 发 的 可 能 性 。 一 个 选择 是 使 用 一 个 
互 不 量 去 面 对 多 个 读者 线程 ， 或 一 个 作者 线程 ， 如 同 在 清单 3.13 中 对 boost::shared_mutex 的 
使 用 一 样 。 虽 然 ， 这 将 提高 并 发 访问 的 可 能 性 ， 但 是 在 同一 时 间 内 ， 也 只 有 一 个 线程 能 对 数 
据 结 构 进 行 修改 。 理 想 很 美好 ， 现 实 很 骨 感 ? 我 们 应 该 能 做 的 更 好 | 


为 细 粒 度 锁 设 计 一 个 映射 结构 


在 对 队列 的 讨论 中 (在 6.2.3 节 )， 为 了 允许 细 粒 度 锁 能 正常 工作 ， 需 要 对 于 数据 结构 的 细节 进行 
仔细 的 考虑 ， 而 非 直 接 使 用 已 存在 的 容器 ， 例 如 std::map<> 。 这 里 列 出 三 个 常见 关联 容器 的 
方式 : 


e ZIP > Hite : 红 黑 树 
o 有 序数 组 
。 哈 布 表 


二 又 树 的 方式 ， 不 会 对 提高 并 发 访问 的 概率 ; 每 一 个 查找 或 者 修改 操作 都 需要 访问 根 节点 ， 
因此 ， 根 节点 需要 上 锁 。 虽 然 ， 访 问 线程 在 向 下 移动 时 ， 这 个 锁 可 以 进行 释放 ， 但 相 比 模 跨 
整个 数据 结构 的 单 锁 ， 并 没有 什么 优势 。 


有 序数 组 是 最 坏 的 选择 ， 因 为 你 无 法 提前 言明 数组 中 哪 段 是 有 序 的 ， 所 以 你 需要 用 一 个 锁 将 
整个 数组 锁 起 来 。 

那么 就 剩 哈 硕 表 了 “。 人 假设 有 固定 数量 的 桶 ， 每 个 桶 都 有 一 个 键 值 (关键 特性 )， 以 及 散 列 函数 。 
这 就 意味 着 你 可 以 安全 的 对 每 个 桶 上 人 锁 。 当 你 再 次 使 用 互 斥 量 (支持 多 读者 单 作者 ) 时 ， 你 就 能 
将 并 发 访问 的 可 能 性 增加 N 倍 ， 这 里 NN 是 桶 的 数量 。 当 然 ， 缺 点 也 是 有 的 : 对 于 键 值 的 操作 ， 


需要 有 合适 的 函数 。C++ 标 准 库 提供 std: :hash<> 模板 ， 可 以 直接 使 用 。 对 于 特 化 的 类 型 ， 比 
如 int， 以 及 通用 库 类 型 std::string ， 并 且 用 户 可 以 简单 的 对 键 值 类 型 进行 特 化 。 如 果 你 去 效 
仿 标 准 无 序 容 器 ， 并 且 获 取 有 函数 对 象 的 类 型 作为 哈 硕 表 的 模板 参数 ， 用 户 可 以 选择 是 否 特 

化 std: :hash<> 的 键 值 类 型 ， 或 者 提供 一 个 独立 的 哈 希 函数 。 


那么 ， 让 我 们 来 看 一 些 代码 吧 。 怎 样 的 实现 才能 完成 一 个 线程 安全 的 查询 表 ? 下 面 就 是 一 种 
清单 6.11 线程 安全 的 查询 表 
template<typename Key, typename Value, typename 


Hash=std: :hash<Key> > 
class threadsafe_lookup_table 


{ 
private: 
class bucket_type 
{ 
private: 
typedef std: :pair<Key,Value> bucket_value; 
typedef std::list<bucket_value> bucket_data; 
typedef typename bucket_data::iterator bucket_iterator; 
bucket_data data; 
mutable boost::shared_mutex mutex; // 1 
bucket_iterator find_entry_for(Key const& key) const // 2 
{ 
return std::find_if(data.begin(),data.end(), 
[&](bucket_value const& item) 
{return item.first==key;}); 
} 
public: 
Value value_for(Key const& key,Value const& default_value) 
const 


{ 


boost: :shared_lock<boost::shared_mutex> lock(mutex); // 3 
bucket_iterator const found_entry=find_entry_for(key); 
return (found_entry==data.end())? 

default_value: found_entry->second; 


void add_or_update_mapping(Key const& key,Value const& 
value) 
{ 
std: :unique_lock<boost::shared_mutex> lock(mutex); // 4 
bucket_iterator const found_entry=find_entry_for(key); 
if (found_entry==data.end()) 


{ 
data.push_back(bucket_value(key, value) ); 
} 
else 
{ 
found_entry->second=value; 
} 
} 


void remove_mapping(Key const& key) 

{ 
std::unique lock<boost::shared mutex> lock(mutex); // 5 
bucket_iterator const found_entry=find_entry_for (key); 
if(found_entry!=data.end() ) 
{ 


data.erase(found_entry); 


} 
}; 


std::vector<std: :unique_ptr<bucket_type> > buckets; // 6 
Hash hasher; 


bucket_type& get_bucket(Key const& key) const // 7 
{ 


std::size_t const bucket_index=hasher(key)%buckets.size(); 
return *buckets[bucket_index]; 


public: 
typedef Key key_type; 
typedef Value mapped_type; 


typedef Hash hash_type; 


threadsafe_lookup_table( 
unsigned num_buckets=19,Hash const& hasher_=Hash()): 
buckets(num_buckets),hasher(hasher_) 


for(unsigned i=0;i<num_buckets;++i) 


{ 


buckets[i].reset(new bucket_type); 


threadsafe_lookup_table(threadsafe_lookup_table const& 


other )=delete; 


P 


这 个 实现 中 使 用 了 std::vector<std: :unique_ptr<bucket_type>> @ 来 保存 桶 4 HAT Ee R 
数 中 指定 构造 桶 的 数量 。 默 认为 19 个 ， 其 是 一 个 任意 的 质数 ; 哈 希 表 在 有 质数 个 桶 时 ， 工 作 效 
率 最 高 。 每 一 个 桶 都 会 被 一 个 boost: :shared_mutex @@ 实 例 锁 保 护 ， 来 允许 并 发 读 取 ， 或 对 每 


threadsafe_lookup_table& operator=( 
threadsafe_lookup_table const& other )=delete; 


Value value_for(Key const& key, 
Value const& default_value=Value()) const 


return get_bucket(key).value_for(key,default_value); // 8 


void add_or_update_mapping(Key const& key,Value const& value) 


{ 
get_bucket(key).add_or_update_mapping(key,value); // 9 


void remove_mapping(Key const& key) 


{ 
get_bucket(key).remove_mapping(key); // 10 


} 


一 个 桶 ， 只 有 一 个 线程 对 其 进行 修改 。 


因为 桶 的 数量 是 国定 的 ， 所 以 get _bucket(0)@ 可 以 无 锁 调 用 ，@@@ 四 也 都 一 样 。 并 且 对 桶 的 互 
斥 量 上 锁 ， 要 不 就 是 共享 (只 读 ) 所 有 权 的 时 候 国 ， 要 不 就 是 在 获取 唯一 ( 读 / 写 ) 权 的 时 候 @@ 。 


这 里 的 互 斥 量 ， 可 适用 于 每 个 成 员 函 数 。 


这 三 个 函数 都 使 用 到 了 find_entry_for() 成 员 函 数 @， 在 桶 上 用 来 确定 数据 是 否 在 桶 中 。 每 一 个 
桶 都 包含 一 个 “ 键 值 -数据 "的 std: :1ist<> 列表 ， 所 以 添加 和 删除 数据 ， 就 会 很 简 单 。 


已 经 从 并 发 的 角度 考虑 了 ， 并 且 所 有 成 员 都 会 被 互 斥 锁 保 护 ， 所 以 这 样 的 实现 就 是 “异常 安 
全 "的 吗 ? value for 是 不 能 修改 任何 值 的 ， 所 以 其 不 会 有 问题 ; 如 果 value for 抛 出 异常 ， 也 不 
会 对 数据 结构 有 任何 影响 。remove_mapping 修 改 链 表 时 ， 将 会 调用 erase， 不 过 这 就 能 保证 
没有 异常 抛 出 ， 那 么 这 里 也 是 安全 的 。 那 么 就 剩 add_or_update_ mapping 了 ， 其 可 能 会 在 其 
两 个 if 分 支 上 抛 出 异常 。push_back 有 是 异常 安全 的 ， 如 果 有 异常 抛 出 ， 其 也 会 将 链表 恢复 成 原 
来 的 状态 ， 所 以 这 个 分 支 是 没有 问题 的 。 唯 一 的 问题 就 是 在 赋值 阶段 ， 这 将 替换 已 有 的 数 

据 ; 当 复 制 阶段 抛 出 异常 ， 用 于 原 依 赖 的 始 状态 没有 改变 。 不 过 ， 这 不 会 影响 数据 结构 的 整 
体 ， 以 及 用 户 提供 类 型 的 属性 ， 所 以 你 可 以 放心 的 将 问题 交 给 用 户 处理 。 


在 本 节 开 始 时 ， 我 提 到 查询 表 的 一 个 可 有 可 无 (nice-to-have) 的 特性 ， 会 将 选择 当前 状态 的 快 

照 ， 例 如 ， 一 个 std::map<> 。 这 将 要 求 锁 住 整个 容器 ， 用 来 保证 拷贝 副本 的 状态 是 可 以 索引 

的 ， 这 将 要 求 锁 住 所 有 的 桶 。 因 为 对 于 查询 表 的 “普通 ”的 操作 ， 需 要 在 同一 时 间 获 取 一 个 桶 上 
的 一 个 锁 ， 而 这 个 操作 将 要 求 查 询 表 将 所 有 桶 都 锁 住 。 因 此 ， 只 要 每 次 以 相同 的 顺序 进行 上 

锁 ( 例 如 ， 递 增 桶 的 索引 值 )， 就 不 会 产生 死 锁 。 实 现 如 下 所 示 : 


清单 6.12 获取 整个 threadsafe_ lookup_table 作 为 一 个 std: :map<> 


std: :map<Key,Value> threadsafe_lookup_table::get_map() const 
{ 
std::vector<std: :unique_lock<boost::shared_mutex> > locks; 
for(unsigned i=0;i<buckets.size();++i) 
{ 
locks .push_back( 
std: :unique_lock<boost: :shared_mutex>(buckets[i].mutex)); 
} 
std: :map<Key, Value> res; 
for(unsigned i=0;i<buckets.size();++i) 
{ 
for(bucket_iterator it=buckets[i].data.begin(); 
it!=buckets[i].data.end(); 
++it) 


res.insert(*it); 


} 


return res; 


清单 6.11 中 的 查询 表 实 现 ， 就 增 大 的 并 发 访问 的 可 能 性 ， 这 个 查询 表 作为 一 个 整体 ， 通 过 单独 
的 操作 对 每 一 个 桶 进行 锁定 2 并 且 通 过 使 用 boost::shared mutex 允许 读者 线程 对 每 一 个 桶 
进行 并 发 访问 。 如 果 细 粒度 锁 和 哈 希 表 结 合 起 来 ， 会 更 有 效 的 增加 并 发 的 可 能 性 吗 ? 


在 下 一 节 中 ， 你 将 使 用 到 一 个 线程 安全 列表 (支持 迭代 器 )。 


6.3.2 编写 一 个 使 用 锁 的 线程 安全 链表 


链表 类 型 是 数据 结构 中 的 一 个 基本 类 型 ， 所 以 应 该 是 比较 好 修改 成 线程 安全 的 ， 对 么 了 其实 
这 取决 于 你 要 添加 什么 样 的 功能 ， 这 其 中 需要 你 提供 迭代 器 的 支持 。 为 了 让 基本 数据 类 型 的 
代码 不 会 太 复杂 ， 我 去 掉 了 一 些 功能 。 迭 代 器 的 问题 在 于 ，STL 类 的 迭代 器 需要 持 有 容器 内 部 
属于 的 引用 。 当 容器 可 被 其 他 线程 修改 时 ， 有 时 这 个 引用 还 是 有 效 的 ; 实际 上 ， 这 里 就 需要 
迭代 器 持 有 锁 ， 对 指定 的 结构 中 的 部 分 进行 上 锁 。 在 给 定 STL 类 迭代 器 的 生命 周期 中 ， 让 其 完 
全 脱离 容器 的 控制 是 很 糟糕 的 。 

茜 代 方案 就 是 提供 迭代 函数 ， 例 如 ， 将 for_each 作 为 容器 本 身 的 一 部 分 。 这 就 能 让 容器 来 对 迭 
代 的 部 分 进行 负责 和 锁定 ， 不 过 这 将 违反 第 3 章 指导 意见 对 避免 死 锁 建议 。 为 了 让 for_each 在 
任何 情况 下 都 有 用 ， 在 其 持 有 内 部 锁 的 时 候 ， 必 须 调 用 用 户 提供 的 代码 。 不 仅 如 此 ， 而 且 需 
要 传递 一 个 对 容器 中 元 素 的 引用 到 用 户 代 码 中 ， 为 的 就 是 让 用 户 代 码 对 容器 中 的 元 素 进行 操 
作 。 你 可 以 为 了 避免 传递 引用 ， 而 传 出 一 个 拷贝 到 用 户 代 码 中 ; 不 过 当 数 据 很 大 时 ， 找 贝 所 
要 付出 的 代价 也 很 大 。 

所 以 ， 可 以 将 避免 死 锁 的 工作 (因为 用 户 提 供 的 操作 需要 获取 内 部 锁 )， 还 有 避免 对 引用 (不 被 
锁 保 护 ) 进 行 存储 时 的 条 件 竞争 ， 交 给 用 户 去 做 。 这 样 的 链表 就 可 以 被 查询 表 所 使 用 了 ， 这 样 
很 安全 ， 因 为 你 知道 这 里 的 实现 不 会 有 任何 问题 。 

那么 剩 下 的 问题 就 是 哪些 操作 需要 列表 所 提供 。 如 果 你 愿 在 花 点 时 间 看 一 下 清单 6.11 和 6.12 中 
的 代码 ， 你 会 看 到 下 面 这 些 操作 是 需要 的 : 


© 向 列表 添加 一 个 元 素 

。 当 某 个 条 件 满 足 时 ， 就 从 链表 中 删除 某 个 元 素 

。 当 某 个 条 件 满 足 时 ， 从 链表 中 查找 某 个 元 素 

© 当 某 个 条 件 满足 时 ， 更 新 链表 中 的 某 个 元 素 

。 将 当前 容器 中 链表 中 的 每 个 元 素 ， 复 制 到 另 一 个 容器 中 


提供 了 这 些 操作 ， 我 们 的 链表 才能 是 一 个 比较 好 的 通用 容器 ， 这 将 帮助 我 们 添加 更 多 功能 ， 
比如 ， 在 指定 位 置 上 插入 元 素 ， 不 过 这 对 于 我 们 查询 表 来 说 就 没有 必要 了 ， 所 以 这 里 就 算是 
给 读者 们 留 的 一 个 作业 吧 。 


使 用 细 粒 度 锁 最 初 的 想法 ， 是 为 了 让 链表 每 个 节点 都 拥有 一 个 互 不 量 。 当 链表 很 长 时 ， 那 么 
就 会 有 很 多 的 互 斥 量 !| 这 样 的 好 处 是 对 于 链表 中 每 一 个 独立 的 部 分 ， 都 能 实现 丨 实 的 并 发 : 其 
监 正 感 兴 趣 的 是 对 持 有 的 节点 群 进行 上 锁 ， 并 且 在 移动 到 下 一 个 节点 的 时 ， 对 当前 节点 进行 
释放 。 下 面 的 清单 中 将 展示 这 样 的 一 个 链表 实现 。 


清单 6.13 线程 安全 链表 一 一 支持 迭代 器 


template<typename T> 
class threadsafe_list 
{ 
struct node // 1 
{ 
std: :mutex m; 
std::shared_ptr<T> data; 
std::unique ptr<node> next; 
node(): // 2 
next() 


{} 


node(T const& value): // 3 
data(std: :make_shared<T>(value) ) 
{} 
}; 


node head; 


public: 
threadsafe_list() 
{} 


~threadsafe_list() 
if 


remove_if([](node const&){return true; }); 


threadsafe_list(threadsafe_list const& other )=delete; 
threadsafe_list& operator=(threadsafe_list const& 
other )=delete; 


void push_front(T const& value) 


{ 


std::unidue_ptr<node> new_node(new node(value)); // 4 
std: :lock_guard<std::mutex> lk(head.m); 
new_node->next=std::move(head.next); // 5 
head.next=std::move(new_node); // 6 


template<typename Function> 
void for_each(Function f) // 7 
{ 
node* current=&head; 
std: :unique_lock<std::mutex> lk(head.m); // 8 
while(node* const next=current->next.get()) // 9 
{ 
std::unique_lock<std::mutex> next_lk(next->m); // 10 
lk.unlock(); // 11 
f(*next->data); // 12 
current=next; 
lk=std: :move(next_1k); // 13 


template<typename Predicate> 
std::shared_ptr<T> find_first_if(Predicate p) // 14 
{ 
node* current=&head; 
std: :unique_lock<std::mutex> lk(head.m); 
while(node* const next=current->next.get()) 
{ 
std: :unique_lock<std::mutex> next_lk(next->m); 
1k.unlock(); 
if(p(*next->data)) // 15 
{ 
return next->data; // 16 
} 
current=next; 
lk=std: :move(next_lk); 
} 


return std::shared_ptr<T>(); 


template<typename Predicate> 
void remove_if(Predicate p) // 17 
{ 
node* current=&head; 
std: :unique_lock<std::mutex> lk(head.m); 
while(node* const next=current->next.get()) 
{ 
std: :unique_lock<std::mutex> next_lk(next->m); 
if(p(*next->data)) // 18 
{ 
std::unique_ptr<node> old_next=std: :move(current->next); 
current ->next=std: :move(next->next); 
next_lk.unlock(); 
} // 20 
else 
{ 
lk.unlock(); // 21 
current=next; 
lk=std: :move(next_lk); 


} 
inn 
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node， 作 为 链表 的 head， 其 next 指 针 @ 指 向 的 是 NULL。 新 节点 都 是 被 push_front() 函 数 添 加 
进去 的 ; 构造 第 一 个 新 节点 @， 其 将 会 在 堆 上 分 配 内 存 回来 对 数据 进行 存储 ， 同 时 将 next 指 针 
置 为 NULL。 然 后 ， 你 需要 获取 head 节 点 的 互 不 锁 ， 为 了 让 设置 next 的 值 回 ， 也 就 是 插入 节点 
到 列表 的 头 部 ， 让 头 节点 的 head.next 指 向 这 个 新 节点 @。 目 前 ， 还 没有 什么 问题 : 你 只 需要 
锁 住 一 个 互 太 量 ， 就 能 将 一 个 新 的 数据 添加 进入 链表 ， 所 以 这 里 不 存在 死 锁 的 问题 。 同 祥 ， 
(缓慢 的 ) 内 存 分 配 操作 在 锁 的 范围 外 ， 所 以 锁 能 保护 需要 更 新 的 一 对 指针 。 那 么 ， 现 在 来 看 一 
下 迭代 功能 。 


首先 ， 来 看 一 下 for_each()@O。 这 个 操作 需要 对 队列 中 的 每 个 元 素 执行 Function( 函 数 指针 ) ; 
在 大 多 数 标准 算法 库 中 ， 都 会 通过 传 值 方 式 来 执行 这 个 函数 ， 这 里 要 不 就 传 入 一 个 通用 的 隐 
数 ， 要 不 就 传 入 一 个 有 函数 操作 的 类 型 对 象 。 在 这 种 情况 下 ， 这 个 函数 必须 接受 类 型 为 T 的 值 
作为 参数 。 在 链表 中 ， 会 有 一 个 “ 手 递 手 " 的 上 人 锁 过 程 。 在 这 个 过 程 开 始 时 ， 你 需要 锁 住 head 及 
节点 加 的 互 太 量 。 然 后 ， 安 全 的 获取 指向 下 一 个 节点 的 指针 (使 用 get() 获 取 ， 这 是 因为 你 对 这 
个 指针 没有 所 有 权 )。 当 指针 不 为 NULL@， 为 了 继续 对 数据 进行 处 理 ， 就 需要 对 指向 的 节点 进 
行 上 锁 四 。 当 你 已 经 锁 住 了 那个 节点 ， 就 可 以 对 上 一 个 节点 进行 释放 了 (D， 并 且 调 用 指定 函数 


(9 。 当 函数 执行 完成 时 ， 你 就 可 以 更 新 当前 指针 所 指向 的 节点 (刚刚 处 理 过 的 节点 )， 并 且 将 所 
有 权 从 next_Ik 移 动 移动 到 |kt43。 因 为 for each 传递 的 每 个 数据 都 是 能 被 Function 接 受 的 ， 所 以 
当 需 要 的 时 ， 需 要 拷贝 到 另 一 个 容器 的 时 ， 或 其 他 情况 时 ， 你 都 可 以 考虑 使 用 这 种 方式 更 新 
每 个 元 素 。 如 果子 数 的 行为 没什么 问题 ， 这 种 方式 是 完全 安全 的 ， 因 为 在 获取 节点 互 斥 锁 

时 ， 已 经 获取 锁 的 节点 正在 被 函数 所 处 理 。 


find_first_if()4D 和 for_each() 很 相似 ; 最 大 的 区 别 在 于 find first if 支持 有 函数 (谓词 ) 在 匹配 的 时 候 
返回 true， 在 不 匹配 的 时 候 返 回 falsedp。 当 条 件 匹 配 ， 只 需要 返回 找到 的 数据 0， 而 非 继续 查 
找 。 你 可 以 使 用 for_each() 来 做 这 件 事 ， 不 过 在 找到 之 后 ， 继 续 做 查找 就 是 没有 意义 的 了 。 


remove_if()@D 就 有 些 不 同 了 ， 因 为 这 个 函数 会 改变 链表 ; 所 以 ， 你 就 不 能 使 用 for_each() 来 实 
现 这 个 功能 。 当 函数 (谓词 ) 返 回 trued@8， 对 应 元 素 将 会 移 除 ， 并 且 更 新 current->nextt9。 当 这 
些 都 做 完 ， 你 就 可 以 释放 next 指 向 节点 的 锁 。 当 std::unique_ptr<node> 的 移动 超出 链表 范围 
C0 ， 这 个 节点 将 被 删除 。 这 种 情况 下 ， 你 就 不 需要 更 新 当前 节点 了 ， 因 为 你 只 需要 修改 next 所 
指向 的 下 一 个 节点 就 可 以 。 当 坊 数 (谓词 ) 返 回 false， 那 么 移动 的 操作 就 和 之 前 一 样 了 (21)。 


那么 ， 所 有 的 互 斥 量 中 会 有 死 锁 或 条 件 竞 争 吗 ? 答案 无 疑 是 “ 否 "， 这 里 要 看 提供 的 函数 (谓词 ) 
是 否 有 良好 的 行为 。 和 迭代 通常 都 是 使 用 一 种 方式 ， 都 是 从 head 节 点 开始 ， 并 且 在 释放 当前 节 
点 锁 之 前 ， 将 下 一 个 节点 的 互 矿 量 锁 住 ， 所 以 这 里 就 不 可 能 会 有 不 同 线程 有 不 同 的 上 锁 顺 
序 。 唯 一 可 能 出 现 条 件 竞争 的 地 方 就 是 在 remove_if()29 中 删除 已 有 节点 的 时 候 。 因 为 ， 这 个 
操作 在 解锁 互 斥 量 后 进行 (其 导致 的 未 定义 行为 ， 可 对 已 上 锁 的 互 斥 量 进行 破坏 )。 不 过 ， 在 考 
虑 一 阵 后 ， 可 以 确定 这 的 确 是 安全 的 ， 因 为 你 还 持 有 前 一 个 节点 (当前 节点 ) 的 互 矿 锁 ， 所 以 不 
会 有 新 的 线程 尝试 去 获取 你 正在 删除 的 那个 节点 的 互 斥 锁 。 


这 里 并 发 概率 有 多 大 呢 ? 细 粒 度 锁 要 比 单 锁 的 并 发 概率 大 很 多 ， 那 我 们 已 经 获得 了 吗 ? 是 
的 ， 你 已 经 获取 了 : 同一 时 间 内 ， 不 同 线程 可 以 在 不 同 节 点 上 工作 ， 无 论 是 其 使 用 for_ each() 
对 每 一 个 节点 进行 处 理 ， 使 用 find first_if() 对 数据 进行 查找 ， 还 是 使 用 remove _if() 删 除 一 些 元 
素 。 不 过 ， 因 为 互 斥 量 必须 按 顺 序 上 锁 ， 那 么 线程 就 不 能 交叉 进行 工作 。 当 一 个 线程 耗费 大 
量 的 时 间 对 一 个 特殊 节点 进行 处 理 ， 那 么 其 他 线程 就 必须 等 待 这 个 处 理 完 成 。 在 完成 后 ， 其 
他 线程 才能 到 达 这 个 节点 。 


6.4 本 章 总 结 


本 章 开 篇 ， 我 们 讨论 了 设计 并 发 数据 结构 的 意义 ， 以 及 给 出 了 一 些 指导 意见 。 然 后 ， 通 过 设 
计 一 些 通用 的 数据 结构 ( 栈 ， 队 列 ， 哈 希 表 和 单 链表 ) ， 探究 了 在 指导 意见 在 实现 这 些 数据 结构 
的 应 用 ， 并 使 用 锁 来 保护 数据 和 避免 数据 竞争 。 那 么 现在 ， 你 应 该 回 看 一 下 本 章 实现 的 那些 
数据 结构 ， 再 回顾 一 下 如 何 增加 并 发 访问 的 几率 ， 和 哪里 会 存在 潜在 条 件 竞争 。 


在 第 7 章 中 ， 我 们 将 看 一 下 如 何 避免 锁 完全 锁定 ， 使 用 底层 原子 操作 来 提供 必要 访问 顺序 约 
束 ， 并 给 出 一 些 指导 意见 。 


第 7 章 无 锁 并 发 数据 结构 设计 


本 章 主要 内 容 


o 设计 无 锁 并 发 数据 结构 
。 无 锁 结构 中 内 存 管 理 技术 
o 对 无 锁 数 据 结构 设计 的 简单 指导 


上 一 章 中 ， 我 们 了 解 了 在 设计 并 发 数据 结构 时 会 遇 到 的 问题 ， 根 据 指导 意见 指引 ， 确 定 设计 
的 安全 性 。 对 一 些 通用 数据 结构 进行 检查 ， 并 查看 使 用 互 斥 锁 对 共享 数据 进行 保护 的 实现 例 
子 。 第 一 组 例子 就 是 使 用 单个 互 斥 量 来 保护 整个 数据 结构 ， 但 之 后 的 例子 就 会 使 用 多 个 锁 来 
保护 数据 结构 的 不 同 部 分 ， 并 且 允 许 对 数据 结构 进行 更 高 级 别 的 并 发 访问 。 


互 斥 量 是 一 个 强大 的 工具 ， 其 可 以 保证 在 多 线程 情况 下 可 以 安全 的 访问 数据 结构 ， 并 且 不 会 
有 条 件 竞 争 或 破坏 不 变量 的 情况 存在 。 对 于 使 用 互 斥 量 的 代码 ， 其 原因 也 是 很 简单 的 : 就 是 
让 互 斥 量 来 保护 数据 。 不 过 ， 这 并 不 会 如 你 所 想 的 那样 ; 你 可 以 回 看 一 下 第 3 章 ， 回 顾 一 下 死 
锁 形 成 的 原因 ， 再 回顾 一 下 基于 锁 的 队列 和 查询 表 的 例子 ， 看 一 下 细 粒 度 锁 是 如 何 影响 并 发 
的 。 如 果 你 能 写 出 一 个 无 锁 并 发 安全 的 数据 结构 ， 那 么 就 能 避免 这 些 问题 。 


在 本 章 中 ， 我 们 还 会 使 用 原子 操作 (第 5 章 介 绍 ) 的 “内 存 序 "特性 ， 并 使 用 这 个 特性 来 构建 无 锁 数 
据 结构 。 设 计 这 样 的 数据 结构 时 ， 要 将 外 的 小 心 ， 因 为 这 样 的 数据 机 构 不 是 那么 容易 正确 实 
现 的 ， 并 且 让 其 失败 的 条 件 很 难 复 现 。 我 们 将 从 无 锁 数据 的 定义 开始 ; 而 后 ， 将 继续 通过 几 
个 例子 来 了 解 使 用 无 锁 数据 结构 的 意义 ， 最 后 给 出 一 些 通用 的 指导 意见 。 


7.1 定义 和 意义 


使 用 互 斥 量 、 条 件 变量 ， 以 及 “期 望 "来 同步 阻塞 数据 的 算法 和 数据 结构 。 应 用 调用 库 函 数 ， 将 
会 挂 起 一 个 执行 线程 ， 直 到 其 他 线程 完成 某 个 特定 的 动作 。 库 函数 将 调用 阻塞 操作 来 对 线程 
进行 阻塞 ， 在 阻塞 移 除 前 ， 线 程 无 法 继续 自己 的 任务 。 通 常 ， 操 作 系统 会 完全 挂 起 一 个 阻塞 
线程 (并 将 其 时 间 片 交 给 其 他 线程 )， 直 到 其 被 其 他 线程 " 解 阻塞 ”;“" 解 阻塞 ”的 方式 很 多 ， 比 如 
解锁 一 个 互 斥 锁 、 通 知 条 件 变量 达成 ， 或 让 期望" 就绪 。 


不 使 用 阻塞 库 的 数据 结构 和 和 工法， 被 称 为 无 阻塞 结构 。 不 过 ， 无 阻塞 的 数据 结构 并 非 都 是 无 
锁 的 ， 那 么 就 让 我 们 见识 一 下 各 种 各 样 的 无 阻塞 数据 结构 吧 | 


7.1.1 非 阻 时 数据 结构 


在 第 5 章 中 ， 我 们 使 用 std::atomic_flag 实现 了 一 个 简单 的 自 旋 锁 。 一 起 回顾 一 下 这 段 代码 。 


清单 7.1 使 用 std::atomic_ flag 实现 了 一 个 简单 的 自 旋 锁 


class spinlock_mutex 
{ 
std::atomic_flag flag; 
public: 
spinlock_mutex(): 
flag(ATOMIC_FLAG_INIT) 
{} 
void lock() 
{ 
while(flag.test and set(std::memory_order_acquire)); 
} 
void unlock() 
{ 
flag.clear(std::memory_order_release) ; 
} 
}; 


这 段 代 码 没 有 调用 任何 阻塞 函数 ，lock() 只 是 让 循环 持续 调用 test_and_set()， 并 返回 false 。 
这 就 是 为 什么 取 名 为 “ 自 旋 锁 ”的 原因 代码 “ 自 旋 "于 循环 当中 。 所 以 ， 这 里 没有 阻塞 调用 ， 
任意 代码 使 用 互 斥 量 来 保护 共享 数据 都 是 非 阻塞 的 。 不 过 ， 自 旋 锁 并 不 是 无 锁 结 构 。 这 里 用 





了 一 个 锁 ， 并 且 一 次 能 锁 住 一 个 线程 。 让 我 们 来 看 一 下 无 锁 结 构 的 具体 定义 ， 这 将 有 助 于 你 
判断 哪些 类 型 的 数据 结构 是 无 锁 的 。 


7.1.2 无 锁 数 据 结 构 


作为 无 锁 结 构 ， 就 意味 着 线程 可 以 并 发 的 访问 这 个 数据 结构 。 线 程 不 能 做 相同 的 操作 ; 一 个 
无 锁 队 列 可 能 允许 一 个 线程 进行 压 入 数据 ， 另 一 个 线程 弹出 数据 ， 当 有 两 个 线程 同时 尝试 添 
加 元 素 时 ， 这 个 数据 结构 将 被 破坏 。 不 仅 如 此 ， 当 其 中 一 个 访问 线程 被 调度 器 中 途 挂 起 时 ， 
其 他 线程 必须 能 够 继续 完成 自己 的 工作 ， 而 无 需 等 待 挂 起 线程 。 


具有 “比较 /交换 "操作 的 数据 结构 ， 通 常 在 “比较 /交换 "实现 中 都 有 一 个 循环 。 使 用 “比较 /交换 " 操 
作 的 原因 : 当 有 其 他 线程 同时 对 指定 数据 的 修改 时 ， 代 码 将 尝试 恢复 数据 。 当 其 他 线程 被 挂 
起 时 ，“ 比 较 / 交 换 " 操 作 执 行 成 功 ， 那 么 这 样 的 代码 就 是 无 锁 的 。 当 执行 失败 时 ， 就 需要 一 个 
自 旋 锁 了 ， 且 这 个 结构 就 是 “ 非 阻塞 -有 和 锁 ” 的 结构 。 


无 锁 算 法 中 的 循环 会 让 一 些 线程 处 于 “ 饥 饭 "状态 。 如 有 线程 在 “错误 "时 间 执 行 ， 那 么 第 一 个 线 
程 将 会 不 停 得 尝试 自己 所 要 完成 的 操作 (其 他 程序 继续 执行 )。“ 无 锁 -无 等 待 "数据 结构 ， 就 为 了 
避免 这 种 问题 存在 的 。 


7.1.3 无 等 待 数据 结构 


无 等 待 数据 结构 就 是 : 首先 ， 是 无 锁 数 据 结构 ; 并 且 ， 每 个 线程 都 能 在 有 限 的 步 数 内 完成 操 
作 ， 暂 且 不 管 其 他 线程 是 如 何 工 作 的 。 由 于 会 和 别 的 线程 产生 冲突 ， 所 以 算法 可 以 进行 无 数 
次 尝试 ， 因 此 并 不 是 无 等 待 的 。 


正确 实现 一 个 无 锁 的 结构 是 十 分 困难 的 。 因 为 ， 要 保证 每 一 个 线程 都 能 在 有 限 步 又 里 完成 操 
作 ， 就 需要 保证 每 一 个 操作 可 以 被 一 次 性 执行 完成 ; 当 有 线程 执行 茶 个 操作 时 ， 不 会 让 其 他 
线程 的 操作 失败 。 这 就 会 让 算法 中 所 使 用 到 的 操作 变 的 相当 复杂 。 


考虑 到 获取 无 锁 或 无 等 待 的 数据 结构 所 有 权 都 很 困难 ， 那 么 就 有 理由 来 写 一 个 数据 结构 了 ; 
需要 保证 的 是 ， 所 要 得 获 益 要 大 于 实现 成 本 。 那 么 ， 就 先 来 找 一 下 实现 成 本 和 所 得 获 益 的 平 
衡 点 吧 | 


7.1.4 无 锁 数据 结构 的 利 与 疯 


使 用 无 锁 结 构 的 主要 原因 : 将 并 发 最 大 化 。 使 用 基于 锁 的 容器 ， 会 让 线程 阻塞 或 等 待 ; LF 
锁 前 弱 了 结构 的 并 发 性 。 在 无 锁 数据 结构 中 ， 某 些 线程 可 以 逐步 执行 。 在 无 等 待 数 据 结 构 

中 ， 无 论 其 他 线程 当时 在 做 什么 ， 每 一 个 线程 都 可 以 转发 进度 。 这 种 理想 的 方式 实现 起 来 很 
难 。 结 构 太 简单 ， 反 而 不 容易 写 ， 因 为 其 就 是 一 个 自 旋 锁 。 


使 用 无 锁 数 据 结 构 的 第 二 个 原因 就 是 鲁 棒 性 。 当 一 个 线程 在 获取 一 个 锁 时 被 杀 死 ， 那 么 数据 
结构 将 被 永久 性 的 破坏 。 不 过 ， 当 线程 在 无 锁 数据 结构 上 执行 操作 ， 在 执行 到 一 半死 亡 时 ， 
数据 结构 上 的 数据 没有 丢失 (除了 线程 本 身 的 数据 )， 其 他 线程 依旧 可 以 正常 执行 。 


另 一 方面 ， 当 不 能 限制 访问 数据 结构 的 线程 数量 时 ， 就 需要 注意 不 变量 的 状态 ， 或 选择 替代 
品 来 保持 不 变量 的 状态 。 同 时 ， 还 需要 注意 操作 的 顺序 约束 。 为 了 避免 未 定义 行为 ， 及 相关 
的 数据 竞争 ， 就 必须 使 用 原子 操作 对 修改 操作 进行 限制 。 不 过 ， 仅 使 用 原子 操作 时 不 够 的 ; 
需要 确定 被 其 他 线程 看 到 的 修改 ， 是 遵循 正确 的 顺序 。 


因为 ， 没 有 任何 锁 ( 有 可 能 存在 活 锁 )， 死 锁 问 题 不 会 困扰 无 锁 数 据 结构 。 活 锁 的 产生 是 ， 两 个 
线程 同时 尝试 修改 数据 结构 ， 但 每 个 线程 所 做 的 修改 操作 都 会 让 另 一 个 线程 重启 ， 所 以 两 个 
线程 就 会 陷入 循环 ， 多 次 的 尝试 完成 自己 的 操作 。 试 想 有 两 个 人 要 过 独木桥 ， 当 两 个 人 从 两 
头 向 中 间 走 的 时 候 ， 他 们 会 在 中 间 碰 到 ， 然 后 不 得 不 再 走 回 出 发 的 地 方 ， 再 次 尝试 过 独 木 

桥 。 这 里 ， 要 打破 僵局 ， 除 非 有 人 先 到 独木桥 的 另 一 端 (或 是 商量 好 了 ， 或 是 走 的 快 ， 或 纯粹 
是 运气 )， 要 不 这 个 循环 将 一 直 重 复 下 去 。 不 过 活 锁 的 存在 时 间 并 不 久 ， 因 为 其 依赖 于 线程 调 
度 。 所 以 其 只 是 对 性 能 有 所 消耗 ， 而 不 是 一 个 长 期 的 问题 ; 但 这 个 问题 仍 需 要 关注 。 根 据 定 
义 ， 无 等 待 的 代码 不 会 被 活 锁 所 困扰 ， 因 其 操作 执行 步骤 是 有 上 限 的 。 换 个 角度 ， 无 等 待 的 
算法 要 比 等 待 算法 的 复杂 度 高 ， 且 即使 没有 其 他 线程 访问 数据 结构 ， 也 可 能 需要 更 多 步骤 来 
完成 对 应 操作 。 


这 就 是 “无 锁 -无 等 待 " 代 码 的 缺点 : 虽然 提高 了 并 发 访问 的 能 力 ， 减 少 了 单个 线程 的 等 待 时 

闻 ， 但 是 其 可 能 会 将 整体 性 能 拉 低 。 首 先 ， 原 子 操作 的 无 锁 代 码 要 慢 于 无 原子 操作 的 代码 ， 
原子 操作 就 相当 于 无 锁 数 据 结 构 中 的 锁 。 不 仅 如 此 ， 硬 件 必 须 通过 同一 个 原子 变量 对 线程 间 
的 数据 进行 同步 。 在 第 8 章 ， 你 将 看 到 与 “乒乓 "缓存 相关 的 原子 变量 (多 个 线程 访问 同时 进行 访 
问 )， 将 会 成 为 一 个 明显 的 性 能 瓶颈 。 在 提交 代码 之 前 ， 无 论 是 基于 锁 的 数据 结构 ， 还 是 无 锁 
的 数据 结构 ， 对 性 能 的 检查 是 很 重要 的 (最 坏 的 等 待 时 间 ， 平 均等 待 时 间 ， 整 体 执行 时 间 ， 或 
者 其 他 指标 ) 。 


让 我 们 先 来 看 几 个 例子 。 


7.2 无 锁 数 据 结构 的 例子 


为 了 演示 一 些 在 设计 无 锁 数 据 结 构 中 所 使 用 到 的 技术 ， 我 们 将 看 到 一 些 无 锁 实现 的 简单 数据 
结构 。 这 里 不 仅 要 在 每 个 例子 中 描述 一 个 有 用 的 数据 结构 实现 ， 还 将 使 用 这 上 
别 之 处 来 冰 述 对 于 无 锁 数据 结构 的 设计 。 


如 之 前 所 提 到 的 ， 无 锁 结 构 依赖 与 原子 操作 和 内 存 序 及 相关 保证 ， 以 确保 多 线程 以 正确 的 顺 
序 访 问 数据 结构 。 最 初 ， 所 有 原子 操作 默认 使 用 的 是 memory_order_ seq_cst 内 存 序 ; 因为 简 
单 ， 所 以 使 用 (所 有 memory_order_seq_cst 都 遵循 一 种 顺序 )。 不 过 ， 在 后 面 的 例子 中 ， 我 们 
将 会 降低 内 存 序 的 要 求 ， 使 用 memory_order_acquire, memory_order_release, 其 至 
memory_order_relaxed。 虽 然 这 个 例子 中 没有 直接 的 使 用 锁 ， 但 需要 注意 的 是 

对 std::atomic_flag 的 使 用 。 一 些 平 台 上 的 无 锁 结 构 实现 (实际 上 在 C++ 的 标准 库 的 实现 中 )， 
使 用 了 内 部 锁 ( 详 见 第 5 章 )。 另 一 些 平台 上 ， 基 于 锁 的 简单 数据 结构 可 能 会 更 适合 ;当然 ， 还 有 
很 多 平台 不 能 一 一 说 明 ; 在 选择 一 种 实现 前 ， 需 要 明确 需求 ， 并 且 配 置 各 种 选项 以 满足 要 


那么 ， 回 到 数据 结构 上 来 吧 ， 最 简单 的 数据 结构 一 一 栈 。 


7.2.1 写 一 个 无 锁 的 线程 安全 覆 


栈 的 要 求 很 简单 : 查询 顺序 是 添加 顺序 的 逆序 一 一 先入 后 出 (LIFO)。 所 以 ， 要 确保 一 个 值 安全 
的 添加 入 栈 就 十 分 重要 ， 因 为 很 可 能 在 添加 后 ， 马 上 被 其 他 线程 索引 ， 同 时 确保 只 有 一 个 线 
程 能 索引 到 给 定 值 也 是 很 重要 。 最 简单 的 栈 就 是 链表 ，head 指 针 指向 第 一 个 节点 (可 能 是 下 一 
个 被 索引 到 的 节点 )， 并 且 每 个 节点 依次 指向 下 一 个 节点 。 


在 这 样 的 情况 下 ， 添 加 一 个 节点 相对 来 说 很 简单 : 


1. 创建 一 个 新 节点。 
2. 将 当 新 节点 的 next 指 针 指 向 当前 的 head 节 点 。 
3. 让 head 节 点 指向 新 节点 。 


在 单线 程 的 上 下 文中 ， 这 种 方式 没有 问题 ， 不 过 当 多 线程 对 栈 进行 修改 时 ， 这 几 步 就 不 够 用 
了 。 至 关 重 要 的 是 ， 当 有 两 个 线程 同时 添加 节点 的 时 候 ， 在 第 2 步 和 第 3 步 的 时 候 会 产生 条 件 
竞争 : 一 个 线程 可 能 在 修改 head 的 值 时 ， 另 一 个 线程 正在 执行 第 2 步 ， 并 且 在 第 3 步 中 对 head 
进行 更 新 。 这 就 会 使 之 前 那个 线程 的 工作 被 丢弃 ， 亦 或 是 造成 更 加 糟糕 的 后 果 。 在 了 解 如 何 
解决 这 个 条 件 竞 争 之 前 ， 还 要 注意 一 个 很 重要 的 事 : 当 head 更 新 ， 并 指向 了 新 节点 时 ， 另 一 
个 线程 就 能 读 取 到 这 个 节点 了 。 因 此 ， 在 head 设 置 为 指向 新 节点 前 ， 让 新 节点 完全 准备 就 绪 
就 变 得 很 重要 了 ; 因为 ， 在 这 之 后 就 不 能 对 节点 进行 修改 了 。 


OK ， 那 如 何 应 对 讨厌 的 条 件 竞 争 呢 ?答案 就 是 : 在 第 3 步 的 时 候 使 用 一 个 原子 "比较 /交换 ? 操 
作 ， 来 保证 当 步 骤 2 对 head 进 行 读 取 时 ， 不 会 对 head 进 行 修改 。 当 有 修改 时 ， 可 以 循环 “比较 / 
交换 ?操作 。 下 面 的 代码 就 展示 了 ， 不 用 锁 来 实现 线程 安全 的 push() 函 数 。 


清单 7.2 不 用 锁 实 现 push() 


template<typename T> 
class lock_free_stack 
{ 
private: 
struct node 
{ 
T data; 
node* next; 


node(T const& data_): // 1 
data(data_) 
{} 

}; 


std::atomic<node*> head; 
public: 
void push(T const& data) 
{ 
node* const new_node=new node(data); // 2 
new_node->next=head.load(); // 3 
while(!head.compare_exchange_weak(new_node->next, new_node) ); 
// 4 
} 
}; 


上 面 代码 近乎 能 匹配 之 前 所 说 的 三 个 步骤 : 创建 一 个 新 节点 回 ， 设 置 新 节点 的 next 指 针 指 向 当 
前 head@， 并 设置 head 指 针 指 向 新 节点 加。node 结 构 用 其 自身 的 构造 济 数 来 进行 数据 坊 充 
@@， 必 须 保证 节点 在 构造 完成 后 随时 能 被 弹出 。 之 后 需要 使 用 compare_exchange_weak() 来 
保证 在 被 存储 到 new_node->next 的 head 指 针 和 之 前 的 一 样 国 。 代 码 的 亮点 是 使 用 "比较 / 交 
换 " 操 作 : 当 其 返回 false 时 ， 因 为 比较 失败 (例如 ，head 被 其 他 线程 锁 修 改 )，new_node->next 
作为 操作 的 第 一 个 参数 ， 将 会 更 新 head。 循 环 中 不 需要 每 次 都 重新 加 载 head 指 针 ， 因 为 编译 
器 会 帮 你 完成 这 件 事 。 同 样 ， 因 为 循环 可 能 直接 就 失败 了 ， 所 以 这 里 使 用 
compare_exchange_weak 要 好 于 使 用 compare_exchange_strong( 详 见 第 5 章 )。 


所 以 ， 这 里 暂时 不 需要 pop() 操 作 ， 可 以 先 快速 检查 一 下 push() 的 实现 是 否 有 违 指导 意见 。 这 
里 唯一 一 个 能 抛 出 异常 的 地 方 就 构造 新 node 的 时 候 @@， 不 过 其 会 自行 处 理 ， 且 链表 中 的 内 容 
没有 被 修改 ， 所 以 这 里 是 安全 的 。 因 为 在 构建 数据 的 时 候 ， 是 将 其 作为 node 的 一 部 分 作为 存 
储 的 ， 并 且 使 用 compare_exchange_weak() 来 更 新 head 指 针 ， 所 以 这 里 没有 恶性 的 条 件 竞 

争 。" 比 较 / 交 换 ? 成 功 时 ， 节 点 已 经 准备 就 绪 ， 且 随时 可 以 提取 。 因 为 这 里 没有 锁 ， 所 以 就 不 
存在 死 锁 的 情况 ， 这 里 的 push() 函 数 实现 的 很 成 功 。 


么 ， 你 现在 已 经 有 往 栈 中 添加 数据 的 方法 了 ， 现 在 需要 删除 数据 的 方法 。 其 步骤 如 下 ， 也 


1. 读 取 当前 head 指 针 的 值 。 

2. 读 取 head->next。 

3. 设置 head 到 head->next。 

4. 通过 索引 node， 返 回 data 数 据 。 
5. 删除 索引 节点 


， 就 不 像 看 起 来 那么 简单 了 。 当 有 两 个 线程 要 从 栈 中 移 除数 据 ， 两 个 线程 

能 在 步 cpt 同一 个 head( 值 相同 )。 当 N AEA EES 而 另 一 个 线程 还 
。 骤 2 时 ， 这 个 还 在 处 理 步 骤 2 的 线程 将 会 解 引用 一 个 悬空 指针 。 这 只 是 写 无 锁 代 码 所 
遇 到 的 ， 所 以 现在 只 能 跳 过 步骤 5， 让 节点 泄露 。 


另 一 个 问题 就 是 : 当 两 个 线程 读 取 到 同一 个 head 值 ， 他 们 将 返回 同一 个 节点 。 这 就 违反 了 栈 
结构 的 意图 ， 所 以 你 需要 避免 这 样 的 问题 产生 。 你 可 以 像 在 push() 函 数 中 解决 条 件 竞 争 那样 来 
解决 这 个 问题 : 使 用 “比较 /交换 "操作 更 新 head。 当 “比较 /交换 "操作 失败 时 ， a ones 
已 被 推 入 ， 就 是 其 他 线程 已 经 弹出 了 想 要 弹出 的 节点 。 无 论 是 那 种 情况 ， 都 得 返回 步骤 1(“ 比 
较 /交换 "操作 将 会 重新 读 取 head) 。 


当 “ 比 较 / 交 换 " 成 功 ， 就 可 以 确定 当前 线程 是 弹出 给 定 节点 的 唯一 线程 ， 之 后 就 可 以 放心 的 执 
行 步骤 4 了 。 这 里 先 看 一 下 pop() 的 维 形 : 


template<typename T> 
class lock_free_stack 
{ 
public: 
void pop(T& result) 
{ 
node* old_head=head. load(); 
while(!head.compare_exchange_weak(old_head,old_head->next)); 
result=old_head->data; 


ia 


虽然 这 段 代码 很 优雅 ， 但 这 里 还 有 两 个 节点 泄露 的 问题 。 首 先 ， 这 段 代码 在 空 o 
工作 : 当 head 指 针 式 一 个 空 指针 时 ， 当 要 访问 next 指 针 时 ， 将 引起 未 定义 行为 。 这 很 容易 通 

过 对 nullptr 的 检查 进行 修复 (在 while 循 环 中 )， 要 不 对 空 栈 抛 出 一 个 异常 ， 要 不 返 a 
来 表明 成 功 与 否 。 


第 二 个 问题 就 是 异常 安全 问题 。 当 在 第 3 章 中 介绍 栈 结构 时 ， 了 解 了 在 返回 值 的 时 候 会 出 现 异 
常安 全 问题 : 当 有 异常 被 抛 出 时 ， 复 制 的 值 将 丢失 。 在 这 种 情况 下 ， 传 入 引用 是 一 种 可 以 接 
受 的 解决 方案 ; 因为 这 样 就 能 保证 ， 当 有 异常 抛 出 时 ， 栈 上 的 数据 不 会 丢失 。 不 幸 的 是 ， 不 
能 这 样 做 ; 只 能 在 单一 线程 对 值 进行 返回 的 时 候 ， 才 进行 拷贝 ， 以 确保 拷贝 操作 的 安全 性 ， 
这 就 意味 着 在 拷贝 结束 后 这 个 节点 就 被 删除 了 。 因 此 ， 通 过 ee ae 

何 优势 : 直接 返回 也 是 可 以 的 。 若 想 要 安全 的 返回 值 ， 你 必须 使 用 第 3 章 中 的 其 他 方法 : 

指向 数据 值 的 (智能 ) 指 针 。 


人 返回 nullptr 以 表明 没有 值 可 返回 ， 但 是 要 求 在 堆 上 对 智能 指针 进 
行内 存 分 配 。 将 分 配 过 程 做 为 pop() 的 一 部 分 时 (也 没有 更 好 的 选择 了 )， 挫 分 配 时 可 能 会 抛 出 

SART ° 与 此 相反 ， 可 以 在 push() 操 作 中 对 内 存 进 行 分 配 一 一 无 论 怎样 ， 都 得 对 node 进 行 

内 存 分 配 。 返 回 一 个 std::shared_ptr<> 不 会 抛 出 异常 ， 所 以 在 pop() 中 进行 分 配 就 是 安全 的 。 

将 上 面 的 观点 放 在 一 起 ， 就 能 看 到 如 下 的 代码 。 


清单 7.3 带 有 节点 泄露 的 无 锁 栈 


template<typename T> 
class lock_free_stack 
{ 
private: 
struct node 
{ 
std::shared_ptr<T> data; // 1 指针 获取 数据 
node* next; 


node(T const& data_): 
data(std::make_shared<T>(data_)) // 2 让 std::shared ptr 指 
向 新 分 配 出 来 的 T 
{} 
}; 


std::atomic<node*> head; 
public: 

void push(T const& data) 

{ 
node* const new_node=new node(data); 
new_node->next=head.load()/; 
while(!head.compare_exchange_weak(new_node->next, new_node) ); 

} 

std::shared_ptr<T> pop() 

{ 
node* old_head=head.load(); 
while(old_head && // 3 在 解 引用 前 检查 01d_head 是 否 为 空 指针 

!head.compare_exchange_weak(old_head,old_head->next)); 

return old_head ? old_head->data : std::shared_ptr<T>(); // 


} 
J 


智能 指针 指向 当前 数据 @@， 这 里 必须 在 堆 上 为 数据 分 配 内 存 (在 node 结 构 体 中 )@ 。 而 后 
compare_exchage_weak() 循 环 中 国 ， 需 要 在 old_head 指 针 前 ， 检 查 指 针 是 否 为 室 。 最 终 ， 
果 存 在 相关 节点 ， 那 么 将 会 返回 相关 节点 的 值 ; 当 不 存在 时 ， 将 返回 一 个 空 指针 @@。 注 ; 

构 是 无 锁 的 ， 但 并 不 是 无 等 待 的 ， 因 为 在 push() 和 pop() 有 函数 中 都 有 while 循 环 ， 当 
compare_exchange_weak() 总 是 失败 的 时 候 ， 循 环 将 会 无 限 循 环 下 去 。 


OF 


总 X. 
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7.2.2 停止 内 存 泄 露 : 使 用 无 锁 数 据 结 构 管 理 内 存 


第 一 次 了 解 pop() 时 ， 为 了 避免 条 件 竞争 ( 当 有 线程 删除 一 个 节点 的 同时 ， 其 他 线程 还 持 有 指向 
该 节点 的 指针 ， 并 且 要 解 引用 ) 选 择 了 带 有 内 存 泄 露 的 节点 。 但 是 ， 不 论 什 么 样 的 c++ 程序 ， 
存在 内 存 泄露 都 不 可 接受 。 所 以 ， 现 在 来 解决 这 个 问题 ! 


基本 问题 在 于 ， 当 要 释放 一 个 节点 时 ， 需 要 确认 其 他 线程 没有 持 有 这 个 节点 。 当 只 有 一 个 线 
程 调用 pop()， 就 可 以 放心 的 进行 释放 。 当 节点 添加 入 栈 后 ，push() 就 不 会 与 节点 有 任何 的 关 
系 了 ， 所 以 只 有 调用 pop() 函 数 的 线程 与 已 加 入 节点 有 关 ， 并 且 能 够 安全 的 将 节点 删除 。 


另 一 方面 ， 当 栈 同时 处 理 多 线程 对 pop() 的 调用 时 ， 就 需要 知道 节点 在 什么 时 候 被 删除 。 这 实 
际 上 就 需要 你 写 一 个 节点 专用 的 垃圾 收集 器 。 这 听 起 来 有 些 可 怖 ， 同 时 也 相当 棘手 ， 不 过 并 
不 是 多 么 糟糕 : 这 里 需要 检查 节点 ， 并 且 检查 哪些 节点 被 pop() 访 问 。 不 需要 对 push() 中 的 节 
点 有 所 担心 ， 因 为 这 些 节点 推 到 栈 上 以 后 ， 才 能 被 访问 到 ， 而 多 线程 只 能 通过 pop() 访 问 同一 
节点 。 


当 没 有 线程 调用 pop() 时 ， 这 时 可 以 删除 栈 上 的 任意 节点 。 因 此 ， 当 添加 节点 到 “可 删除 "列表 
中 时 ， 就 能 从 中 提取 数据 了 。 而 后 ， 当 没有 线程 通过 pop() 访 问 节点 时 ， 就 可 以 安全 的 删除 这 
些 节点 了 。 那 怎么 知道 没有 线程 调用 pop() 了 呢 ? 很 简单 一 一 计数 即 可 。 当 计数 器 数值 增加 
时 ， 就 是 有 节点 推 入 ; 当 减 少时 ， 就 是 有 节点 被 删除 。 这 样 从 “可 删除 ”列表 中 删除 节点 就 很 安 
全 了 ， 直 到 计数 器 的 值 为 0 为 止 。 当 然 ， 这 个 计数 器 必须 是 原子 的 ， 这 样 它 才能 在 多 线程 的 情 
况 下 正确 的 进行 计数 。 下 面 的 清单 中 ， 展 示 了 修改 后 的 pop() 函 数 ， 有 些 支持 功能 的 实现 将 在 
清单 7.5 中 给 出 。 


清单 7.4 没有 线程 通过 pop() 访 问 节 点 时 ， 就 对 节点 进行 回收 


template<typename T> 
class lock_free_stack 
{ 
private: 
std::atomic<unsigned> threads_in_pop; // 1 原子 变量 
void try_reclaim(node* old_head); 
public: 
std::shared_ptr<T> pop() 
{ 
++threads_in_pop; // 2 在 做 事 之 前 ， 计 数值 加 1 
node* old_head=head.load(); 
while(old_head && 
!head.compare_exchange_weak(old_head, old_head->next) ); 
std::shared_ptr<T> res; 
if(old_head) 
{ 
res.swap(old_head->data); // 3 回收 删除 的 节点 
} 
try_reclaim(old_head); // 4 从 节点 中 直接 提取 数据 ， 而 非 找 贝 指针 
return res; 
} 
}; 


threads_in_pop@ 原 子 变量 用 来 记录 有 多 少 线程 试图 弹出 栈 中 的 元 素 。 当 pop()@ 函 数 调 用 的 
时 候 ， 计 数 器 加 一 ; 当 调 用 try_reclaim() 时 ， 计 数 器 减 一 ， 当 这 个 函数 被 节点 调用 时 ， 说 明 这 
个 节点 已 经 被 删除 @。 因 为 暂时 不 需要 将 节点 删除 ， 可 以 通过 swap() 函 数 来 删除 节点 上 的 数据 
@( 而 非 只 是 拷贝 指针 )， 当 不 再 需要 这 些 数据 的 时 候 ， 这 些 数据 会 自动 删除 ， 而 不 是 持续 存在 
着 (因为 这 里 还 有 对 未 删除 节点 的 引用 )。 接 下 来 看 一 下 try_reclaim() 是 如 何 实现 的 。 


清单 7.5 采用 引用 计数 的 回收 机 制 


template<typename T> 
class lock_free_stack 


{ 


private: 
std::atomic<node*> to_be_deleted; 


static void delete_nodes(node* nodes) 


i 


while(nodes ) 


node* next=nodes->next; 
delete nodes; 
nodes=next; 


} 
} 
void try_reclaim(node* old_head) 
{ 

if(threads_in_pop==1) // 1 

{ 


node* nodes_to_delete=to_be_deleted.exchange(nullptr); 
2 声明 “可 删除 ”列表 
if(!--threads_in_pop) // 3 是 否 只 有 一 个 线程 调用 pop()? 


{ 
delete_nodes(nodes_to_delete); // 4 
} 
else if(nodes to delete) //5 
{ 
chain_pending_nodes(nodes_to_delete); // 6 
} 
delete old_head; // 7 
} 
else 
{ 


chain_pending_node(old_head); // 8 
--threads_in_pop; 


} 


void chain_pending_nodes(node* nodes) 


{ 


node* last=nodes; 


// 


while(node* const next=last->next) // 9 让 next 指 针 指 向 链表 的 末 


尾 
{ 
last=next; 
} 
chain_pending_nodes(nodes, last); 


void chain_pending_nodes(node* first,node* last) 


last->next=to_be_deleted; // 10 
while(!to_be_deleted.compare_exchange_weak( // 11 用 循环 来 保 
证 last->next 的 正确 性 
last->next, first)); 


} 
void chain_pending_node(node* n) 
{ 
chain_pending_nodes(n,n); // 12 
} 


后 


回收 节点 时 @，threads in_pop 的 数值 是 1， 也 就 是 当前 线程 正在 对 pop() 进 行 访 问 ， 这 时 就 可 
以 安全 的 将 节点 进行 删除 了 @( 将 等 待 节点 删除 也 是 安全 的 )。 当 数值 不 是 1 时 ， 删 除 任何 节点 
都 不 安全 ， 所 以 需要 向 等 待 列 表 中 继续 添加 节点 轿 。 


假设 在 某 一 时 刻 ，threads_in_pop 的 值 为 1。 那 就 可 以 尝试 回收 等 待 列 表 ， 如 果 不 回 收 ， 节 点 
就 会 继续 等 待 ， 直 到 整个 栈 被 销毁 。 要 做 到 回收 ， 首 先 要 通过 一 个 原子 exchange 操 作 声 明 @ 
删除 列表 ， 并 将 计数 器 减 一 国 。 如 果 之 后 计数 的 值 为 0， 就 意味 着 没有 其 他 线程 访问 等 待 节点 
链表 。 出 现 新 的 等 待 节点 时 ， 不 必 为 其 烦恼 ， 因 为 它们 将 被 安全 的 回收 。 而 后 ， 可 以 使 用 
delete_nodes 对 链表 进行 和 迭代， 并 将 其 删除 @ © 


当 计 数值 在 减 后 不 为 0， 回 收 节点 就 不 安全 ; 所 以 如 果 存 在 回 ， 就 需要 将 其 挂 在 等 待 删除 链表 
之 后 @， 这 种 情况 会 发 生 在 多 个 线程 同时 访问 数据 结构 的 时 候 。 一 些 线程 在 第 一 次 测试 
threads_in_pop@ 和 对 “回收 "链表 的 声明 回 操 作 间 调用 pop()， 这 可 能 新 填 入 一 个 已 经 被 线程 访 
问 的 节点 到 链表 中 。 在 图 7.1 中 ， 线 程 C 添 加 节点 Y 到 to_be_deleted 链 表 中 ， 即 使 线程 B 仍 将 其 
引用 作为 old_head， 之 后 会 尝试 访问 其 next 指 针 。 在 线程 A 删除 节点 的 时 候 ， 会 造成 线程 BB 发 
生 未 定义 的 行为 。 


初始 化 
to_be deteteda—> a }—> 


threads_in_pop == 0 





线程 A 调 用 pop()， 在 首次 读 取 threads_in_pop 后 ， 被 try_reclaim() 占 有 


to_be_deleted—>f a| —> 


threads_in_pop == 1 (线程 A) 





线程 B 调 用 pop()， 在 首次 读 取 head 后 被 占有 


rae = 


old_head 


to_be deleted 


threads_in pop == 2 (线程 A 和 B) 





线程 C 调 用 pop()， 并 且 直 到 pop() 返 回 后 继续 运行 


to_be deleted. > 


threads in pop == 2 (线程 A 和 B)(C 已 经 结束 ) 








线程 A 继续 执行 ， 在 to_be_deleted.exchange(nullptr) 执 行 后 被 占有 





head 


nodes_to_delete 





如 果 不 对 threads_in_pop 进 行 再 次 检查 ， 那 么 A 将 删除 Y 节 点 。 
threads_in pop == 2 


to_be_deleted——~» nullptr 


线程 B 继 续 ， 在 compare_exchange_strong() 调 用 后 读 取 old_head->next 


head = 


old_head X 





threads in pop == 2 节点 Y 在 A 的 to_be_deleted 列 表 上 





图 7.1 三 个 线程 同时 调用 pop()， 说 明 为 什么 要 在 try_reclaim() 对 声明 节点 进行 删除 前 ， 对 
threads_in_pop 进 行 检查 。 


为 了 将 等 待 删除 的 节点 添加 入 等 待 删除 链表 ， 需 要 复 用 节点 的 next 指 针 将 等 待 删除 节点 链接 在 
一 起 。 在 这 种 情况 下 ， 将 已 存在 的 链表 链接 到 删除 链表 后 面 ， 通 过 遍历 的 方式 找到 链表 的 末 
尾 @， 将 最 后 一 个 节点 的 next 指 针 替 换 为 当前 to_be_deleted 指 针 @， 并 且 将 链表 中 的 第 一 个 
节点 作为 新 的 to_be_deleted 指 针 进 行 存储 (DD。 这 里 需要 在 循环 中 使 用 
compare_exchange_weak 来 保证 ， 通 过 其 他 线程 添加 进来 的 节点 不 会 发 生 内 存 泄露 。 这 样 ， 
在 链表 发 生 改 变 时 ， 更 新 next 指针 很 方便 。 添 加 单个 节点 是 一 种 特殊 情况 ， 因 为 这 需要 将 这 个 
节点 作为 第 一 个 节点 ， 同 时 也 是 最 后 一 个 节点 进行 添加 (D 。 


在 低 负荷 的 情况 下 ， 这 种 方式 没有 问题 ， 因 为 在 没有 线程 访问 pop()， 有 一 个 合适 的 静态 指 
针 。 不 过 ， 这 只 是 一 个 瞬时 的 状态 ， 也 就 是 为 什么 在 回收 前 ， 需 要 检查 threads_in_pop 计 数 为 
0@ 的 原因 ; 同样 也 是 删除 节点 @ 前 进行 对 计数 器 检查 的 原因 。 删 除 节点 是 一 项 耗 时 的 工作 ， 
并 且 希 望 其 他 线程 能 对 链表 做 的 修改 越 小 越 好 。 从 第 一 次 发 现 threads _in_pop 是 1， 到 尝试 删 
除 节点 ， 会 用 很 长 的 时 间 ， 这 样 就 会 让 线程 有 机 会 调用 pop()， 会 让 threads in_pop 不 为 0， 阻 
止 节点 的 删除 操作 。 


在 高 负荷 的 情况 ， 不 会 存在 静态 ; 因为 ， 其 他 线程 在 初始 化 之 后 ， 都 能 进入 pop()。 在 这 样 的 
情况 下 ，to_ne_deleted 链 表 将 会 无 界 的 增加 ， 并 且 会 再 次 泄露 。 当 这 里 不 存在 任何 静态 的 情 
况 时 ， 就 得 为 回收 节点 寻找 替代 机 制 。 关 键 是 要 确定 没有 线程 访问 一 个 给 定 节点 ， 那 么 这 个 
节点 就 能 被 回收 。 现 在 ， 最 简单 的 替换 机 制 就 是 使 用 风险 指针 (hazard pointer) 。 


7.2.3 检测 使 用 风险 指针 (不 可 回收 ) 的 节点 


“风险 指针 ”这 个 术语 引用 于 Maged Michael 的 技术 发 现 [1]。 之 所 以 这 样 叫 ， 是 因为 删除 一 个 节 
点 可 能 会 让 其 他 引用 其 的 线程 处 于 危险 之 中 。 当 其 他 线程 持 有 这 个 删除 的 节点 的 指针 ， 并 且 
解 引 用 进行 操作 的 时 候 ， 将 会 出 现 未 定义 行为 。 这 里 的 基本 观点 就 是 ， 当 有 线程 去 访问 要 被 
(其 他 线程 ) 删 除 的 对 象 时 ， 会 先 设置 对 这 个 对 象 设置 一 个 风险 指针 ， 而 后 通知 其 他 线程 ， 删 除 
这 个 指针 是 一 个 危险 的 行为 。 一 旦 这 个 对 象 不 再 被 需要 ， 那 么 就 可 以 清除 风险 指针 了 。 如 果 
了 解 牛 津 /剑桥 的 龙舟 比赛 ， 那 么 这 里 使 用 到 的 机 制 和 龙舟 比赛 开赛 时 差不多 : 每 个 船上 的 舵 
手 都 举 起 手 来 ， 以 表示 他 们 还 没有 准备 好 。 只 要 有 舵手 的 手 是 举 着 的 ， 那 么 裁判 就 不 能 让 比 
赛 开 始 。 当 所 有 舵手 的 手 都 放下 后 ， 比 赛 才 能 开始 ; 在 比赛 还 未 开始 或 感觉 自己 船 队 的 情况 
有 变 时 ， 舵 手 可 以 再 次 举 手 。 


当 线 程 想 要 删除 一 个 对 象 ， 那 么 它 就 必须 检查 系统 中 其 他 线程 是 否 持 有 风险 指针 。 当 没有 风 
险 指 针 的 时 候 ， 那 么 它 就 可 以 安全 删除 对 象 。 否 则 ， 它 就 必须 等 待 风 险 指 针 的 消失 了 。 这 
样 ， 线 程 就 得 周期 性 的 检查 其 想 要 删除 的 对 象 是 否 能 安全 删除 。 


看 起 来 很 简单 ， 在 cr+ 中 应 该 怎么 做 呢 ? 


首先 ， 需 要 一 个 地 点 能 存储 指向 访问 对 象 的 指针 ， 这 个 地 点 就 是 风险 指针 。 这 个 地 点 必须 能 
让 所 有 线程 看 到 ， 需 要 其 中 一 些 线程 可 以 对 数据 结构 进行 访问 。 如 何 正 确 和 高 效 的 分 配 这 些 
线程 ， 的 确 是 一 个 挑战 ， 所 以 这 个 问题 可 以 放 在 后 面 解 决 ， 而 后 假设 你 有 一 个 
get_hazard_pointer for_current thread() 的 函数 ， 这 个 函数 可 以 返回 风险 指针 的 引用 。 当 你 
读 取 一 个 指针 ， 并 且 想 要 解 引 用 它 的 时 候 ， 你 就 需要 这 个 函数 一 一 在 这 种 情况 下 head 数 值 源 
于 下 面 的 列表 : 


std::shared_ptr<T> pop() 
{ 
std: :atomic<void*>& 
hp=get_hazard_pointer_for_current_thread(); 
node* old _head=head.load(); // 1 
node* temp; 
do 
if 
temp=old_head; 
hp.store(old_head); // 2 
old_head=head.load(); 
} while(old_head!=temp); // 3 
OA 


在 while 循 环 中 就 能 保证 node 不 会 在 读 取 卓 head 指针 @@ 时 ， 以 及 在 设置 风险 指针 的 时 被 删除 
了 。 这 种 模式 下 ， 其 他 线程 不 知道 有 线程 对 这 个 给 定 的 节点 进行 了 访问 。 幸 运 的 是 ， 当 日 
head 节 点 要 被 删除 时 ，head 本 身 是 要 改变 的 ， 所 以 需要 对 head 进 行 检 查 ， 并 持续 循环 ， 直 到 
head 指 针 中 的 值 与 风险 指针 中 的 值 相 同 加。 使 用 风险 指针 ， 如 同 依赖 对 已 删除 对 象 的 引用 。 
当 使 用 默认 的 new 和 delete 操 作对 风险 指针 进行 操作 时 ， 会 出 现 未 定义 行为 ， 所 以 需要 确定 实 
现 是 否 支持 这 样 的 操作 ， 或 使 用 自 定 义 分 配器 来 保证 这 种 用 法 的 正确 性 。 


现在 已 经 设置 了 风险 指针 ， 那 就 可 以 对 pop() 进 行 处 理 了 ， 基 于 现在 了 解 到 的 安全 知识 ， 这 里 
不 会 有 其 他 线程 来 删除 节点 。 啊 哈 | 这 里 每 一 次 重新 加 载 old_head 时 ， 解 引用 刚刚 读 取 到 的 
指针 时 ， 就 需要 更 新 风险 指针 。 当 从 链表 中 提取 一 个 节点 时 ， 就 可 以 将 风险 指针 清除 了 。 如 
果 没 有 其 他 风险 指针 引用 节点 ， 就 可 以 安全 的 删除 节点 了 ; 否则 ， 就 需要 将 其 添加 到 链表 
中 ， 之 后 再 将 其 删除 。 下 面 的 代码 就 是 对 该 方案 的 完整 实现 。 


清单 7.6 使 用 风险 指针 实现 的 pop() 


std::shared_ptr<T> pop() 
{ 
std: :atomic<void*>& 
hp=get_hazard_pointer_for_current_thread(); 
node* old_head=head.load(); 
do 
{ 
node* temp; 
do // 1 直到 将 风险 指针 设 为 head 指 针 
{ 
temp=old_head; 
hp.store(old_head); 
old_head=head.load(); 
} while(old_head!=temp); 
} 
while(old_head && 
!head.compare_exchange_strong(old_head,old_head->next)); 
hp.store(nullptr); // 2 当 声 明 完成 ， 清 除 风 险 指针 
std::shared_ptr<T> res; 
if (old_head) 
{ 
res.swap(old_head->data); 
if(outstanding_hazard_pointers_for(old_head)) // 3 在 删除 之 前 
对 风险 指针 引用 的 节点 进行 检查 
{ 
reclaim_later(old_head); // 4 


} 
else 
{ 
delete old_head; // 5 
} 


delete_nodes_with_no_hazards(); // 6 


} 


return res; 


首先 ， 循 环 内 部 会 对 风险 指针 进行 设置 ， 在 当 " 比 较 /交换 "操作 失败 会 重 载 old_head， 再 次 进 
行 设置 中。 使 用 compare_exchange_strong()， 是 因为 需要 在 循环 内 部 做 一 些 实际 的 工作 : 当 
compare_exchange_weak() 伪 失败 后 ， 风 险 指 针 将 被 重 置 (没有 必要 )。 这 个 过 程 能 保证 风险 


指针 在 解 引用 (old_head) 之 前 ， 能 被 正确 的 设置 。 当 已 声明 了 一 个 风险 指针 ， 那 么 就 可 以 将 其 
清除 了 @。 如 果 想 要 获取 一 个 节点 ， 就 需要 检查 其 他 线程 上 的 风险 指针 ， 检 查 是 否 有 其 他 指针 
引用 该 节点 加。 如 果 有 ， 就 不 能 删除 节点 ， 只 能 将 其 放 在 链表 中 ， 之 后 再 进行 回收 图 ; 如 果 没 
有 ， 就 能 直接 将 这 个 节点 删除 了 回 。 最 后 ， 如 果 需 要 对 任意 节点 进行 检查 ， 可 以 调用 
reclaim_later()。 如 果 链 表 上 没有 任何 风险 指针 引用 节点 ， 就 可 以 安全 的 删除 这 些 节 点 @@。 当 
有 节点 持 有 风险 指针 ， 就 只 能 让 下 一 个 调用 pop() 的 线程 离开 。 


当然 ， 这 些 函 数 一 get_hazard_pointer for_current thread(), reclaim_later(), 
outstanding_hazard_pointers for(), 和 delete_nodes_with_no_hazards() 一 一 的 实现 细节 我 们 
还 没有 看 到 ， 先 来 看 看 它们 是 如 何 工作 的 。 


为 线程 分 配 风险 指针 实例 的 具体 方案 : 使 用 get_hazard_pointer for_current thread() 与 程序 
逻辑 的 关系 并 不 大 (不 过 会 影响 效率 ， 接 下 会 看 到 具体 的 情况 )。 可 以 使 用 一 个 简单 的 结构 体 : 
定 长 度 的 “线程 ID- 指 针 "” 数 组 。get_hazard_pointer for_curent_ thread() 就 可 以 通过 这 个 数据 
来 找到 第 一 个 释放 楷 ， 并 将 当前 线程 的 ID 放 入 到 这 个 档 中 。 当 线程 退出 时 ， 模 就 再 次 置 空 ， 
可 以 通过 默认 构造 std: :thread::id() 将 线程 ID 放 入 楼 中。 这 个 实现 就 如 下 所 示 : 


清单 7.7 get_hazard_pointer_for_current_thread() $ 2 49 f # & 


unsigned const max_hazard_pointers=100; 
struct hazard_pointer 
{ 
std: :atomic<std::thread::id> id; 
std: :atomic<void*> pointer; 
}; 


hazard_pointer hazard_pointers[max_hazard_pointers]; 


class hp_owner 


{ 


hazard_pointer* hp; 


public: 
hp_owner(hp_owner const&)=delete; 
hp_owner operator=(hp_owner const&)=delete; 
hp_owner(): 
hp(nullptr) 


for(unsigned i=0;i<max_hazard_pointers;++i) 
{ 
std::thread::id old_id; 
if(hazard_pointers[i].id.compare_exchange_strong( // 6 2 
试 声明 风险 指针 的 所 有 权 


old_id,std::this_thread: :get_id())) 


{ 
hp=&hazard_pointers[i]; 
break; // 7 
} 
} 
if(!hp) // 1 
{ 
throw std::runtime_error("No hazard pointers available"); 
} 
} 
std: :atomic<void*>& get_pointer() 
{ 
return hp->pointer; 
} 


~hp_owner() // 2 
{ 
hp->pointer.store(nullptr); // 8 
hp->id.store(std::thread::id()); // 9 
} 
J; 


std: :atomic<void*>& get_hazard_pointer_for_current_thread() // 
3 
{ 

thread_local static hp_owner hazard; // 4 每 个 线程 都 有 自己 的 风险 
指针 

return hazard.get_pointer(); // 5 


get_hazard_pointer for_current thread() 的 实现 看 起 来 很 简单 四 : 一 个 hp_owner@ 类 型 的 
thread_ local( 本 线程 所 有 ) 变 量 ， 用 来 存储 当前 线程 的 风险 指针 ， 可 以 返回 这 个 变量 所 持 有 的 
指针 回 。 之 后 的 工作 : 第 一 次 有 线程 调用 这 个 函数 时 ， 新 hp_owner 实 例 就 被 创建 。 这 个 实例 
的 构造 函数 @@， 会 通过 查询 “所 有 者 /指针 ”" 表 ， 导 找 没有 所 有 者 的 记录 。 其 用 
compare_exchange _strong() 来 检查 某 个 记录 是 否 有 所 有 者 ， 并 进行 析 构 @。 当 
compare_exchange_strong() 失 败 ， 其 他 线程 的 拥有 这 个 记录 ， 所 以 可 以 继续 执行 下 去 。 当 交 
换 成 功 ， 当 前 线程 就 拥有 了 这 条 记录 ， 而 后 对 其 进行 存储 ， 并 停止 搜索 四。 当 人 遍历 了 列表 也 没 
有 找到 物 所 有 权 的 记录 @， 就 说 明 有 很 多 线程 在 使 用 风险 指针 ， 所 以 这 里 将 抛 出 一 个 异常 。 


一 旦 hp_owner 实 例 被 一 个 给 定 的 线程 所 创建 ， 那 么 之 后 的 访问 将 会 很 快 ， 因 为 指针 在 缓存 
中 ， 所 以 表 不 需要 再 次 遍历 。 


当 线 程 退 出 时 ，hp_owner 的 实例 将 会 被 销毁 。 析 构 函 数 会 在 std: :thread: :id() 设置 拥有 者 ID 
前 ， 将 指针 重 置 为 nullptr, 这 样 就 允许 其 他 线程 对 这 条 记录 进行 复 用 @@。 


实现 get_hazard_pointer_for_current_thread() 后 ，outstanding_hazard_pointer_ for() 实 现 就 简 
BY: 只 需要 对 风险 指针 表 进 行 搜索 ， 就 可 以 找到 对 应 记录 。 


bool outstanding_hazard_pointers_for(void* p) 


{ 
for(unsigned i=0;i<max_hazard_pointers;++1) 
{ 
if(hazard_pointers[i].pointer.load()==p) 
{ 
return true; 
} 
} 
return false; 
} 


实现 都 不 需要 对 记录 的 所 有 者 进行 验证 : 没有 所 有 者 的 记录 会 是 一 个 空 指针 ， 所 以 比较 代码 
将 总 返回 false， 通 过 这 种 方式 将 代码 简化 。 


reclaim_later() 和 delete_nodes_with_no_hazards() 可 以 对 简单 的 链表 进行 操作 ; 
reclaim_later() 只 是 将 节点 添加 到 列表 中 ，delete_nodes with_no_hazards() 就 是 搜索 整个 列 
表 ， 并 将 无 风险 指针 的 记录 进行 删除 。 下 面 将 展示 它们 的 具体 实现 。 


清单 7.8 回收 函数 的 简单 实现 


template<typename T> 
void do_delete(void* p) 
{ 


delete static_cast<T*>(p); 


struct data_to_reclaim 

{ 
void* data; 
std::function<void(void*)> deleter; 
data_to_reclaim* next; 


template<typename T> 

data_to_reclaim(T* p): // 1 
data(p), 
deleter(&do_delete<T>), 
next (0) 

{} 


~data_to_reclaim() 
{ 
deleter(data); // 2 
} 
}; 


std::atomic<data to reclaim*> nodes_to_reclaim; 


void add_to_reclaim_list(data_to_reclaim* node) // 3 
{ 
node->next=nodes_to_reclaim.load(); 
while(!nodes_to_reclaim.compare_exchange_weak(node- 
>next,node) ); 


} 


template<typename T> 
void reclaim_later(T* data) // 4 
{ 


add_to_reclaim_list(new data_to_reclaim(data)); // 5 


void delete_nodes_with_no_hazards() 
{ 
data_to_reclaim* current=nodes_to_reclaim.exchange(nullptr); 
// 6 
while(current) 
{ 
data_to_reclaim* const next=current->next; 
if(!outstanding_hazard_pointers_for(current->data)) // 7 
{ 
delete current; // 8 


} 


else 





add_to_reclaim_list(current); // 9 


} 


current=next; 


首先 ，reclaim_later() 是 一 个 函数 模板 @@。 因 为 风险 指针 是 一 个 通用 解决 方案 ， 所 以 这 里 就 不 
能 将 栈 节 点 的 类 型 写 死 。 使 用 std: :atomic<void*> 对 风险 指针 进行 存储 有 需要 对 任意 类 型 的 
指针 进行 处 理 ， 不 过 不 能 使 用 void* 形式 ， 因 为 当 要 删除 数据 项 时 ，delete 操 作 只 能 对 实际 类 
型 指针 进行 操作 。data to_reclaim 的 构造 函数 处 理 的 就 很 优雅 : reclaim_ later() 只 是 为 指针 创 

建 一 个 data_to_reclaim 的 实例 ， 并 且 将 实例 添加 到 回收 链表 中 加 。add_to_reclaim _list()@ 就 

是 使 用 compare_exchange_weak() 循 环 来 访问 链表 头 (就 如 你 之 前 看 到 的 那样 )。 


当 将 节点 添加 入 链表 时 ，data_to_reclaim 的 析 构 函数 不 会 被 调用 ; 析 构 函数 会 在 没有 风险 指 
针 指 向 节点 的 时 候 调用 ， 这 也 就 是 delete_nodes_ with_no_hazards() 的 作用 。 


delete_nodes_ with_no_hazards() 将 已 声明 的 链表 节点 进行 回收 ， 使 用 的 是 exchange() 函 数 
@( 这 个 步骤 简单 且 关键 ， 是 为 了 保证 只 有 一 个 线程 回收 这 些 节 点 )。 这 样 ， 其 他 线程 就 能 自由 
将 节点 添加 到 链表 中 ， 或 在 不 影响 回收 指定 节点 线程 的 情况 下 ， 对 节点 进行 回收 。 


只 要 有 节点 存在 于 链表 中 ， 就 需要 检查 每 个 节点 ， 查 看 节点 是 否 被 风险 指针 所 指向 @。 如 果 没 
有 风险 指针 ， 那 么 就 可 以 安全 的 将 记录 删除 (并 且 清 除 存 储 的 数据 )@@。 否 则 ， 就 只 能 将 这 个 节 
点 添加 到 链表 的 后 面 ， 再 进行 回收 加 。 


虽然 这 个 实现 很 简单 ， 也 的 确 安全 的 回收 了 被 删除 的 节点 ， 不 过 这 个 过 程 增 加 了 很 多 开销 。 
遍历 风险 指针 数组 需要 检查 max_hazard_pointers 原 子 变 量 ， 并 且 每 次 pop() 调 用 时 ， 都 需要 
再 检查 一 遍 。 原 子 操作 很 耗 时 一 一 在 台式 CPU 上 ，100 次 原子 操作 要 上 比 100 次 非 原子 操作 慢 
_ 所以， 这 里 pop() 成 为 了 性 能 瓶颈 。 这 种 方式 ， 不 仅 需要 遍历 节点 的 风险 指针 链表 ， 还 要 
遍历 等 待 链表 上 的 每 一 个 节点 。 显 然 ， 这 种 方式 很 糟糕 。 当 有 max_hazard_pointers 在 链表 
中 ， 那 么 就 需要 检查 max_hazard_pointers 多 个 已 存储 的 风险 指针 。 我 去 ! 还 有 更 好 一 点 的 方 
法 吗 ? 


对 风险 指针 ( 较 好 ) 的 回收 策略 


当然 有 更 好 的 办 法 。 这 里 只 展示 一 个 风险 指针 的 简单 实现 ， 来 帮助 解释 技术 问题 。 首 先 ， 要 
考虑 的 是 内 存 性 能 。 比 起 对 回收 链表 上 的 每 个 节点 进行 检查 都 要 调用 pop()， 除 非 有 超过 
max_hazard_pointer 数 量 的 节点 存在 于 链表 之 上 ， 要 不 就 不 需要 尝试 回收 任何 节点 。 这 样 就 
能 保证 至 少 有 一 个 节点 能 够 回收 ， 如 果 只 是 等 待 链表 中 的 节点 数量 达到 
max_hazard_pointers+1， 那 比 之 前 的 方案 也 没 好 到 哪里 去 。 当 获取 了 max_hazard_pointers 
数量 的 节点 时 ， 可 以 调用 pop() 对 节点 进行 回收 ， 所 以 这 样 也 不 是 很 好 。 不 过 ， 当 有 
2max_hazard_pointers 个 节点 在 列表 中 时 ， 就 能 保证 至 少 有 max_hazard_pointers 可 以 被 回 
收 ， 在 再 次 尝试 回收 任意 节点 前 ， 至 少 会 对 pop() 有 max_hazard_pointers 次 调用 。 这 就 很 不 


错 了 。 比 起 检查 max_hazard_pointers 个 节点 就 调用 max_hazard_pointers 次 pop()( 而 且 还 不 一 
定 能 回收 节点 )， 当 检查 2max_hazard_pointers 个 节点 时 ， 每 max_hazard_pointers 次 对 pop() 
的 调用 ， 就 会 有 max_hazard_pointers 个 节点 能 被 回收 。 这 就 意味 着 ， 对 两 个 节点 检查 调用 


pop()， 其 中 就 有 一 个 节点 能 被 回收 。 


这 个 方法 有 个 缺点 (有 增加 内 存 使 用 的 情况 ) : 就 是 得 对 回收 链表 上 的 节点 进行 计数 ， 这 就 意味 
着 要 使 用 原子 变量 ， 并 且 还 有 很 多 线程 争 相 对 回收 链表 进行 访问 。 如 果 还 有 多 余 的 内 存 ， 可 
以 增加 内 存 的 使 用 来 实现 更 好 的 回收 策略 : 每 个 线程 中 的 都 拥有 其 自己 的 回收 链表 ， 作 为 线 
程 的 本 地 变量 。 这 样 就 不 需要 原子 变量 进行 计数 了 。 这 样 的 话 ， 就 需要 分 配 
max_hazard_pointers x max_hazard_pointers 个 节点 。 所 有 节点 被 回收 完毕 前 时 ， 有 线程 退 
出 ， 那 么 其 本 地 链表 可 以 像 之 前 一 样 保存 在 全 局 中 ， 并 且 添 加 到 下 一 个 线程 的 回收 链表 中 ， 
让 下 一 个 线程 对 这 些 节点 进行 回收 。 


风险 指针 另 一 个 缺点 : 与 |BM 申 请 的 专利 所 冲突 [2] 。 要 让 写 的 软件 在 一 个 国家 中 使 用 ， 那 么 就 
必须 拥有 合法 的 知识 产权 ， 所 以 需要 拥有 合适 的 许可 证 。 这 对 所 有 无 锁 
用 (这 是 一 个 活跃 的 研究 领域 ) ， 所 以 很 多 大 公司 都 会 有 自己 的 专利 。 你 可 能 会 问 ，" 为 什么 

De er 
种 技术 可 能 不 需要 买 一 个 许可 证 。 比 如 ， 当 你 使 用 GPL 下 的 免费 软件 许可 来 进行 软件 开发 ， 
那么 你 的 软件 将 会 包含 到 IBM 不 主张 声明 中 。 其 次 ， 也 是 很 重要 的 ， 在 设计 无 锁 代 码 的 时 候 ， 
还 需要 从 使 用 的 技术 角度 进行 思考 ， 比 如 ， 高 消耗 的 原子 操作 。 


所 以 ， 是 否 有 非 专利 的 内 存 回收 技术 ， 且 能 被 大 多 数 人 所 使 用 呢 ? 很 幸运 ， 的 确 有 。 引 用 计 
数 就 是 这 样 一 种 机 制 。 


7.2.4 检测 使 用 引用 计数 的 节点 


回 到 7.2.2 节 的 问题 ，“ 想 要 删除 节点 还 能 被 其 他 读者 线程 访问 ， 应 该 怎么 办 ?"。 当 能 安全 并 精 
确 的 识别 ， 节 点 是 否 还 被 引用 ， ，。 问 这 些 节点 的 具体 时 间 ， 以 便 将 对 应 - 点 进 
行 删除 。 风 险 指针 是 通过 将 使 用 中 的 节点 存放 到 链表 中 ， 解 决 问题 。 而 引用 计数 是 通过 对 每 
个 节点 上 访问 的 线程 数量 进行 统计 ， 解 决 问题 。 


看 起 来 简单 粗暴 ..…….. 不 ， 优 雅 ; 实际 上 管理 起 来 却 是 很 困难 : 首先 ， 你 会 想到 ee 

由 std: :shared_ptr<> 来 完成 这 个 任务 ， 其 是 有 内 置 引 用 计数 的 指针 。 不 幸 的 是 a 

然 std::shared_ptr<> 上 的 一 些 操作 是 原子 的 ， 不 过 其 也 不 能 保证 是 无 锁 的 。 智 能 ae 
子 操作 和 对 其 他 原 子 类 型 的 操作 并 没有 什么 不 同 ， 但 是 std: :shared_ptr<> A 由 在 用 于 有 多 个 上 
下 文 的 情况 下 ， 并 且 在 无 锁 结构 中 使 用 原子 操作 ， 无 异 于 对 该 类 增加 了 很 多 性 能 开销 。 如 果 
平台 支持 std::atomic_is_lock_free(&some_shared_ptr) 实现 返回 true， 那 么 所 有 内 存 回 收 问 题 
就 都 迎刃而解 了 。 使 用 std::shared_ptr<node> 构成 的 链表 实现 ， 如 下 所 示 : 


清单 7.9 无 锁 栈 一 使 用 无 锁 std::shared_ptr<> 的 实现 


template<typename T> 
class lock_free_stack 


{ 
private: 
struct node 
{ 
std::shared_ptr<T> data; 
std::shared_ptr<node> next; 
node(T const& data_): 
data(std: :make_shared<T>(data_) ) 
{} 
J; 
std::shared_ptr<node> head; 
public: 
void push(T const& data) 
{ 
std::shared_ptr<node> const new_node=std: :make_shared<node> 
(data); 
new_node->next=head.load(); 
while(!std::atomic_compare_exchange_weak(&head, 
&new_node->next, new_node) ); 
} 
std::shared_ptr<T> pop() 
{ 
std::shared_ptr<node> old_head=std::atomic_load(&head); 
while(old_head && !std::atomic_compare_exchange_weak(&head, 
&old_head, old_head->next)); 
return old_head ? old_head->data : std::shared_ptr<T>(); 
} 
J; 


在 一 些 情况 下 ， 使 用 std::shared_ptr<> 实现 的 结构 并 非 无 锁 ， 这 就 需要 手动 管理 引用 计数 。 


一 种 方式 是 对 每 个 节点 使 用 两 个 引用 计数 : 内 部 计数 和 外 部 计数 。 两 个 值 的 总 和 就 是 对 这 个 
节点 的 引用 数 。 外 部 计数 记录 有 多 少 指针 指向 节点 ， 即 在 指针 每 次 进行 读 取 的 时 候 ， 外 部 计 
数 加 一 。 当 线程 结束 对 节点 的 访问 时 ， 内 部 计数 减 一 。 指 针 在 读 取 时 ， 外 部 计数 加 一 ; A 
取 结 束 时 ， 内 部 计数 减 一 。 


当 不 需要 "外 部 计数 -指针 "对 时 (该 节点 就 不 能 被 多 线程 所 访问 了 )， 在 外 部 计数 减 一 和 在 被 弃 用 
的 时 候 ， 内 部 计数 将 会 增加 。 当 内 部 计数 等 于 0， 那 么 就 没有 指针 对 该 节点 进行 引用 ， 就 可 以 
将 该 节点 安全 的 删除 。 使 用 原子 操作 来 更 新 共享 数据 也 很 重要 。 现 在 ， 就 让 我 们 来 看 一 下 使 
用 这 种 技术 实现 的 无 锁 栈 ， 只 有 确定 节点 能 安全 删除 的 情况 下 ， 才 能 进行 节点 回收 。 


下 面 程序 清单 中 就 展示 了 内 部 数据 结构 ， 以 及 对 push() 简 单 优 雅 的 实现 。 


清单 7.10 使 用 分 离 引 用 计数 的 方式 推送 一 个 节点 到 无 锁 栈 中 


template<typename T> 
class lock_free_stack 
{ 
private: 

struct node; 


struct counted_node_ptr // 1 
{ 

int external_count; 

node* ptr; 


Ji 


struct node 

{ 
std::shared_ptr<T> data; 
std: :atomic<int> internal_count; // 2 
counted_node_ptr next; // 3 


node(T const& data_): 
data(std: :make_shared<T>(data_)), 
internal_count(0) 
{} 
J; 


std::atomic<counted_node_ptr> head; // 4 


public: 
~lock_free_stack() 
{ 
while(pop()); 


void push(T const& data) // 5 
{ 
counted_node_ptr new_node; 
new_node.ptr=new node(data); 
new_node.external_count=1; 
new_node.ptr->next=head.load(); 
while(!head.compare_exchange_weak(new_node. ptr- 
>next,new_node) ); 
} 
J; 


外 部 计数 包含 在 counted_node_ptr 的 指针 中 加， 且 这 个 结构 体会 被 node 中 的 next 指 针 @@ 和 内 
部 计数 加 用 到 。counted_node_ ptr 是 一 个 简单 的 结构 体 ， 所 以 可 以 使 用 特 化 std::atomic<> 模 
板 来 对 链表 的 头 指 针 进 行 声明 @。 


且 counted_node_ptr 体 积 够 小 ， 能 够 让 std::atomic<counted_node_ptr> 无 锁 。 在 一 些 平台 上 
支持 双 字 比较 和 交换 操作 ， 可 以 We 。 当 你 的 平台 不 支持 这 样 的 操作 时 ， 
最 好 使 用 std::shared_ptr<> 变量 (如 清单 7.9 那 样 ) ; 型 的 体积 过 大 ， 超 出 了 平台 支持 指 
> MARFA std::atomic<> 将 使 用 锁 来 保证 其 操作 ~ 子 性 (从 而 会 让 你 的 “无 锁 " 算 法 “基于 
o 另外 ， 如 果 想 要 限制 计数 器 的 大 小 ， 需 要 已 知 平台 上 指针 所 占 的 空间 (比如 ， 地 

A A st Re 间 内 ， 不 过 为 了 适 
T ， 也 可 以 存在 一 个 机 器 字 当 中 。 这 样 的 技巧 需要 对 特定 系统 有 足够 的 了 解 ， 当 然 已 经 
超出 本 书 讨论 的 范围 。 


push() 相 对 简单 @ 回 ， 可 以 构造 一 个 counted_node_ ptr 实例 ， 去 引用 新 分 配 出 来 的 ( 带 有 相关 数 
据 的 )hode， 并 且 将 node 中 的 next 指 针 设 置 为 当前 head。 之 后 使 用 
compare_exchange_weak() 对 head 的 值 进行 设 置 ， 就 像 之 前 代码 清单 中 所 示 。 因 为 
internal_count 刚 被 设置 ， 所 以 其 值 为 0， 并 且 external_ count 是 1。 因为 这 是 一 个 新 节点 ， 那 
么 这 个 节点 只 有 一 个 外 部 引用 (head 指 针 ) 。 


通常 ，pop() 都 有 一 个 从 繁 到 简 的 过 程 ， 实 现代 码 如 下 。 


清单 7.11 使 用 分 离 引 用 计数 从 无 锁 栈 中 弹出 一 个 节点 


template<typename T> 
class lock_free_stack 
{ 
private: 
void increase_head_count(counted_node_ptr& old_counter ) 


{ 


counted_node_ptr new_counter; 


do 
{ 


new_counter=old_counter; 
++new_counter.external_count; 


while(!head.compare_exchange_strong(old_counter,new_counter )); 


// 1 


old_counter.external_count=new_counter.external_count; 
} 
public: 
std::shared_ptr<T> pop() 
{ 
counted_node_ptr old_head=head.load(); 
for(;;) 
{ 
increase_head_count(old_head); 
node* const ptr=old_head.ptr; // 2 
if(!ptr) 
{ 
return std::shared_ptr<T>(); 
} 
if(head.compare_exchange_strong(old_head, ptr->next) ) 
{ 
std::shared_ptr<T> res; 
res.swap(ptr->data); // 4 


int const count_increase=old_head.external_count-2; 


if(ptr->internal_count.fetch_add(count_increase)== 


-count_increase) 


delete ptr; 


return res; // 7 


} 


else if(ptr->internal_count.fetch_sub(1)==1) 


L E 


// 


// 6 


delete ptr; // 8 


} 
}; 


当 加 载 head 的 值 之 后 ， 就 必须 将 外 部 引用 加 一 ， 是 为 了 表明 这 个 节点 正在 引用 ， 并 且 保 证 在 
解 引 用 时 的 安全 性 。 在 引用 计数 增加 前 解 引 用 指针 ， 那 么 就 会 有 线程 能 够 访问 这 个 节点 ， 从 
而 当前 引用 指针 就 成 为 了 一 个 悬空 指针 。 这 就 是 将 引用 计数 分 离 的 主要 原因 : 通过 增加 外 部 
引用 计数 ， 保 证 指针 在 访问 期 间 的 合法 性 。 在 compare_exchange _strong() 的 循环 中 国 完 成 增 
加 ， 通 过 比较 和 设置 整个 结构 体 来 保证 指针 不 会 在 同一 时 间 内 被 其 他 线程 修改 。 


当 计 数 增加 ， 就 能 安全 的 解 引用 ptr， 并 读 取 head 指 针 的 值 ， 就 能 访问 指向 的 节点 回 。 如 果 指 
针 是 空 指针 ， 那 么 将 会 访问 到 链表 的 最 后 。 当 指针 不 为 空 时 ， 就 能 尝试 对 head 调 用 
compare_exchange_strong() 来 删除 这 个 节点 @。 


当 compare_exchange_strong() 成 功 时 ， 就 拥有 对 应 节点 的 所 有 权 ， 并 且 可 以 和 data 进 行 交 换 
图 ， 然 后 返回 。 这 样 数据 就 不 会 持续 保存 ， 因 为 其 他 线程 也 会 对 栈 进行 访问 ， 所 以 会 有 其 他 指 
针 指 向 这 个 节点 。 而 后 ， 可 以 使 用 原子 操作 fetch_add@， 将 外 部 计数 加 到 内 部 计数 中 去 。 如 
果 现 在 引用 计数 为 0， 那 么 之 前 的 值 (fetch_add 返 回 的 值 )， 在 相 加 之 前 肯定 是 一 个 负数 ， 这 种 
情况 下 就 可 以 将 节点 删除 。 这 里 需要 注意 的 是 ， 相 加 的 值 要 比 外 部 引用 计数 少 2@; 当 节点 已 经 
从 链表 中 删除 ， 就 要 减少 一 次 计数 ， 并 且 这 个 线程 无 法 再 次 访问 指定 节点 ， 所 以 还 要 再 减 

一 。 无 论 节 点 是 否 被 删除 ， 都 能 完成 操作 ， 所 以 可 以 将 获取 的 数据 进行 返回 @ © 


当 “ 比 较 / 交 换 " 国 失败 ， 就 说 明 其 他 线程 在 之 前 把 对 应 节点 删除 了 ， 或 者 其 他 线程 添加 了 一 个 新 
的 节点 到 栈 中 。 无 论 是 哪 种 原因 ， 需 要 通过 “比较 /交换 ”的 调用 ， 对 具有 新 值 的 head 重 新 进行 
操作 。 不 过 ， 首 先 需 要 减少 节点 (要 删除 的 节点 ) 上 的 引用 计数 。 这 个 线程 将 再 也 没有 办 法 访问 
这 个 节点 了 。 如 果 当 前 线程 是 最 后 一 个 持 有 引用 (因为 其 他 线程 已 经 将 这 个 节点 从 栈 上 删除 了 ) 
的 线程 ， 那 么 内 部 引用 计数 将 会 为 1， 所 以 减 一 的 操作 将 会 让 计数 器 为 0。 这 样 ， 你 就 能 在 循 
环 @@ 进 行 之 前 将 对 应 节点 删除 了 。 


目前 ， 使 用 默认 sta: :memory_order_seq_cst 内 存 序 来 规定 原子 操作 的 执行 顺序 。 在 大 多 数 系 
统 中 ， 这 种 操作 方式 都 很 耗 时 ， 且 同步 操作 的 开销 要 高 于 内 存 序 。 现 在 ， 就 可 以 考虑 对 数据 
结构 的 逻辑 进行 修改 ， 对 数据 结构 的 部 分 放宽 内 存 序 要 求 ; 就 没有 必要 在 栈 上 增加 过 度 的 开 
销 了 。 现 在 让 我 们 来 检查 一 下 栈 的 操作 ， 并 且 扣 心 自 同 ， 这 里 能 对 一 些 操作 使 用 更 加 宽松 的 
AGRA? 如 果 使 用 了 ， 能 确保 同 级 安全 吗 ? 


7.2.5 应 用 于 无 锁 栈 上 的 内 存 模型 


在 修改 内 存 序 之 前 ， 需 要 检查 一 下 操作 之 间 的 依赖 关系 。 而 后 ， 再 去 确定 适合 这 种 需求 关系 
的 最 小 内 存 序 。 为 了 保证 这 种 方式 能 够 工作 ， 需 要 在 从 线程 的 视角 进行 观察 。 其 中 最 简单 的 
视角 就 是 ， 向 栈 中 推 入 一 个 数据 项 ， 之 后 让 其 他 线程 从 栈 中 弹出 这 个 数据 。 


即使 在 简单 的 例子 中 ， 都 需要 三 个 重要 的 数据 参与 。1、counted_node_ ptr 转移 的 数据 head。 
2、head 引 用 的 node。3、 节 点 所 指向 的 数据 项 。 


做 push() 的 线程 ， 会 先 构 造 数 据 项 和 节点 ， 再 设置 head。 做 pop() 的 线程 ， 会 先 加 载 head 的 
值 ， 再 做 在 循环 中 对 head 做 “比较 /交换 "操作 ， 并 增加 引用 计数 ， 再 读 取 对 应 的 node 节 点 ， 获 
取 next 的 指向 的 值 ， 现 在 就 可 以 看 到 一 组 需求 关系 。next 的 值 是 普通 的 非 原 子 对 象 ， 所 以 为 了 
保证 读 取 安 全 ， 这 里 必须 确定 存储 (推送 线程 ) 和 加 载 (弹出 线程 ) 的 先行 关系 。 因 为 唯一 的 原子 
操作 就 是 push() 函 数 中 的 compare_exchange_weak()， 这 里 需要 释放 操作 来 获取 两 个 线程 间 
的 先行 关系 ， 这 里 compare_exchange_weak() 必 须 是 std::memory_order_release 或 更 严格 的 
内 存 序 。 当 compare_exchange_weak() 调 用 失败 ， 什 么 都 不 会 改变 ， 并 且 可 以 持续 循环 下 
去 ， 所 以 使 用 std: :memory_order_relaxed 就 足够 了 。 


void push(T const& data) 

{ 
counted_node_ptr new_node; 
new_node.ptr=new node(data); 
new_node.external_count=1; 
new_node.ptr->next=head.load(std::memory_order_relaxed) 
while(!head.compare_exchange_weak(new_node.ptr->next,new_node, 

std: :memory_order_release, std: :memory_order_relaxed)); 


那 pop() 的 实现 呢 ? 为 了 确定 先行 关系 ， 必 须 在 访问 next 值 之 前 使 

用 std: :memory_order_acquire 或 更 严格 内 存 序 的 操作 。 因 为 ， 在 increase_head_count() 中 使 
用 compare_exchange_strong() 就 获取 next 指 针 指 向 的 昌 值 ， 所 以 想 要 其 获取 成 功 就 需要 确定 
内 存 序 。 如 同调 用 push() 那 样 ， 当 交换 失败 ， 循 环 会 继续 ， 所 以 在 失败 的 时 候 使 用 松散 的 内 存 
F : 


void increase_head_count(counted_node_ptr& old_counter ) 


i 


counted_node_ptr new_counter; 


do 
{ 
new_counter=old_counter; 
++new_counter.external_count; 
} 
while(!head.compare_exchange_strong(old_counter,new_counter, 
std: :memory_order_acquire, std: :memory_order_relaxed)); 


old_counter.external_count=new_counter.external_count; 


当 compare_exchange_strong() 调 用 成 功 ， 那 么 ptr 中 的 值 就 被 存 到 old_counter 中 。 和 存储 操作 
是 push() 中 的 一 个 释放 操作 ， 并 且 compare_exchange_strong() 操 作 是 一 个 获取 操作 ， 现 在 存 
储 同步 于 加 载 ， 并 且 能 够 获取 先行 关系 。 因 此 ， 在 push() 中 存储 ptr 的 值 ， 要 先行 于 在 pop() 中 
对 ptr->next 的 访问 。 现 在 的 操作 就 安全 了 。 


要 注意 的 是 ， 内 存 序 对 head.load() 的 初始 化 并 不 妨碍 分 析 ， 所 以 现在 就 可 以 使 


用 std::memory_order_relaxed ° 


接 下 来 ，compare_exchange _strong() 将 old_head.ptr->next 设 置 为 head。 是 否 需 要 做 什么 来 
保证 操作 线程 中 的 数据 完整 性 呢 ? 当 交 换 成 功 ， 你 就 能 访问 ptr->data， 所 以 这 里 需要 保证 在 
push() 线 程 中 已 经 对 ptr->data 进 行 了 存储 (在 加 载 之 前 )。 在 increase_head count() 中 的 获取 操 
作 ， 能 保证 与 push() 线 程 中 的 存储 和 "比较 /交换 "同步 。 这 里 的 先行 关系 是 : 在 push() 线 程 中 存 
储 数据 ， 先 行 于 存储 head 指 针 ; 调用 increase_head count() 先 行 于 对 ptr->data 的 加 载 。 即 
使 ， pop() 中 的 “比较 /交换 "操作 使 用 std: :memory_order_relaxed ， 这 些 操作 还 是 能 正常 运行 。 
唯一 不 同 的 地 方 就 是 ， 调 用 swap() 让 ptr->data 有 所 变化 ， 且 没有 其 他 线程 可 以 对 同一 节点 进 
行 操作 (这 就 是 “比较 /交换 "操作 的 作用 ) 。 


当 compare_exchange_strong() 失 败 ， 那 么 新 值 就 不 会 去 更 新 old_head， 继 续 循环 。 这 里 ， 已 
确定 在 increase_head count() 中 使 用 std::memory_order_acquire 内 存 序 的 可 行 性 ， 所 以 这 里 
使 用 std: :memory_order_relaxed 也 可 以 。 


其 他 线程 呢 ? 是 否 需要 设置 一 些 更 为 严格 的 内 存 序 来 保证 其 他 线程 的 安全 呢 ? 回答 是 “不 用 ”。 
为 ，head 只 会 因 " 比 较 /交换 "操作 有 所 改变 ; 对 于 “ 读 - 改 - 写 " 操 作 来 说 ，push() 中 的 “比较 / 交 
换 " 操 作 是 构成 释放 序列 的 一 部 分 。 因 此 ， 即 使 有 很 多 线程 在 同一 时 间 对 head 进 行 修改 ， 
push() 中 的 compare_exchange_weak() 与 increase_head_count()( 读 取 已 存储 的 值 ) 中 的 
compare_exchange_strong() 也 是 同步 的 。 


剩余 操作 就 可 以 用 来 处 理 fetch add() 操 作 (用 来 改变 引用 计数 的 操作 ) ， 因 为 已 知 其 他 线程 不 可 
能 对 该 节点 的 数据 进行 修改 ， 所 以 从 节点 中 返回 数据 的 线程 可 以 继续 执行 。 不 过 ， 当 线程 获 
取 其 他 线程 修改 后 的 值 时 ， 就 代表 操作 失败 (swap() 是 用 来 提取 数据 项 的 引用 )。 那 么 ， 为 了 避 
免 数据 竞争 ， 需 要 保证 swap() 先 行 于 delete 操 作 。 一 种 简单 的 解决 办 法 ， 在 “成 功 返 回 " 分 支 中 
对 fetch_add() 使 用 std: :memory_order_release 内 存 序 ， 在 “再 次 循环 "分 支 中 对 fetch_add() 使 
用 std::memory_order_qcquire 内 存 序 。 不 过 ， 这 就 有 点 矫 枉 过 正 : 只 有 一 个 线程 做 delete 操 作 
(将 引用 计数 设置 为 0 的 线程 )， 所 以 只 有 这 个 线程 需要 获取 操作 。 幸 运 的 是 ， 因 为 fetch_addf() 
是 一 个 “ 读 - 改 - 写 " 操 作 ， 是 释放 序列 的 一 部 分 ， 所 以 可 以 使 用 一 个 额外 的 load() 做 获取 。 当 “再 
次 循环 ”分支 将 引用 计数 减 为 0 时 ，fetch_add() 可 以 重 载 引 用 计数 ， 这 里 使 

用 std::memory_order_acquire 为 了 保持 需求 的 同步 关系 ; 并 且 ， fetch_add() 本 身 可 以 使 

用 std: :memory_order_relaxed ° 使 用 新 pop() 的 栈 实现 如 下 


清单 7.12 基于 引用 计数 和 松散 原子 操作 的 无 锁 栈 


template<typename T> 
class lock_free_stack 
{ 
private: 
struct node; 
struct counted_node_ptr 
{ 
int external_count; 
node* ptr; 


HF 


struct node 

{ 
std::shared_ptr<T> data; 
std::atomic<int> internal_count; 
counted_node_ptr next; 


node(T const& data_): 
data(std: :make_shared<T>(data_)), 
internal_count(0) 


{} 
}; 


std::atomic<counted_node_ptr> head; 


void increase_head_count(counted_node_ptr& old_counter) 


{ 


counted_node_ptr new_counter; 


do 
new_counter=old_counter; 
++new_counter.external_count; 


} 


while(!head.compare_exchange_strong(old_counter,new_counter, 


std: :memory_order_acquire, 


std: :memory_order_relaxed) ); 
old_counter.external_count=new_counter.external_count; 
} 
public: 
~lock_free_stack() 
{ 
while(pop()); 


void push(T const& data) 
{ 
counted_node_ptr new_node; 
new_node.ptr=new node(data); 
new_node.external_count=1; 
new_node.ptr->next=head.1load(std: :memory_order_relaxed) 
while(!head.compare_exchange_weak(new_node.ptr - 
>next,new_node, 
std: :memory_order_release, 


std: :memory_order_relaxed) ); 
} 
std::shared_ptr<T> pop() 
{ 
counted_node_ptr old_head= 
head.load(std::memory_order_relaxed); 
for(;;) 
{ 
increase_head_count(old_head); 
node* const ptr=old_head.ptr; 


if(!ptr) 
{ 


return std::shared_ptr<T>(); 


} 


if(head.compare_exchange_strong(old_head, ptr->next, 


std: :memory_order_relaxed)) 


{ 
std::shared_ptr<T> res; 
res.swap(ptr->data); 


int const count_increase=old_head.external_count-2; 


if(ptr->internal_count.fetch_add(count_increase, 
std: :memory_order_release)==-count_increase ) 


delete ptr; 


return res; 
} 
else if(ptr->internal_count.fetch_add(-1, 
std: :memory_order_relaxed)==1) 


ptr->internal_count.load(std: :memory_order_acquire) ; 
delete ptr; 


} 
| 号 


这 是 一 种 锻炼 ， 不 过 锻炼 要 告 一 段落 了 ， 我 们 已 经 获得 比 之 前 好 很 多 的 栈 实现 。 在 深思 熟 上 处 
后 ， 通 过 使 用 更 多 的 松散 操作 ， 在 不 影响 并 发 性 的 同时 提高 性 能 。 实 现 中 的 pop() 有 37 行 ， 而 
功能 等 同 于 清单 6.1 中 的 那 7 行 的 基于 锁 的 栈 实现 ， 和 清单 7.2 中 无 内 存 管理 的 无 锁 栈 实现 。 对 
于 接 下 来 要 设计 的 无 锁 队 列 ， 将 看 到 类 似 的 情况 : 无 锁 结 构 的 复杂 性 ， 主 要 在 于 内 存 的 管 
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7.2.6 写 一 个 无 锁 的 线程 安全 队列 


队列 的 提供 的 挑战 与 栈 的 有 些 不 同 ， 因 为 push() 和 pop() 在 队列 中 ， 操 作 的 不 是 同一 个 地 方 。 
因此 ， 同 步 的 需求 就 不 一 样 了 。 需 要 保证 对 一 端的 修改 是 正确 的 ， 且 对 另 一 端 是 可 见 的 。 不 
过 ， 在 清单 6.6 中 队列 有 一 个 try_pop() 成 员 函 数 ， 其 作用 和 清单 7.2 中 简单 的 无 锁 栈 的 pop() 功 
能 差不多 ， 那 么 就 可 以 合理 的 假设 无 锁 代 码 都 很 相似 。 这 是 为 什么 呢 ? 


如 果 将 清单 6.6 中 的 代码 作为 基础 ， 就 需要 两 个 node 指 针 : head 和 tail。 可 以 让 多 线程 对 它们 
进行 访问 ， 所 以 这 两 个 节点 最 好 是 原子 的 ， 这 样 就 不 用 考虑 互 斥 问题 了 。 让 我 们 对 清单 6.6 中 
的 代码 做 一 些 修改 ， 并 且 看 一 下 应 该 从 哪里 开始 设计 。 先 来 看 一 下 下 面 的 代码 。 


清单 7.13 单 生 产 者 / 单 消费 者 模型 下 的 无 锁 队 列 


template<typename T> 
class lock_free_queue 
{ 
private: 
struct node 
{ 
std::shared_ptr<T> data; 
node* next; 


node(): 
next(nullptr) 
{} 
}; 


std::atomic<node*> head; 
std::atomic<node*> tail; 


node* pop_head() 
{ 
node* const old_head=head.load(); 
if(old_head==tail.load()) // 1 
{ 
return nullptr; 
} 
head. store(old_ head->next ); 
return old_head; 
} 
public: 
lock_free_queue(): 
head(new node), tail(head.load() ) 


{} 


lock_free_queue(const lock_free_queue& other )=delete; 
lock_free_queue& operator=(const lock_free_queue& 
other )=delete; 


~lock_free_queue( ) 
{ 
while(node* const old_head=head.1load() ) 
{ 
head. store(old_head->next); 
delete old_head; 


} 
std::shared_ptr<T> pop() 


{ 
node* old _head=pop_head()/; 
if(!old_head) 
{ 


return std::shared_ptr<T>(); 


std::shared_ptr<T> const res(old_head->data); // 2 
delete old_head; 
return res; 


void push(T new_value) 

{ 
std::shared_ptr<T> new_data(std: :make_shared<T>(new_value) ); 
node* p=new node; // 3 
node* const old_tail=tail.load(); // 4 
old_tail->data.swap(new_data); // 5 
old_tail->next=p; // 6 
tail.store(p); // 7 
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一 眼 望 去 ， 这 个 实现 并 没什么 不 好 ， 当 只 有 一 个 线程 调用 一 次 push()， 且 只 有 一 个 线程 调用 
pop()°。 在 这 种 情况 下 ， 队 列 完美 工作 。push() 和 pop() 之 间 的 先行 关系 就 很 重要 了 ， 这 直接 关 
系 到 获取 到 的 data。 对 tail 的 存储 @ 同 步 于 对 tail 的 加 载 @ ; 存储 之 前 节点 的 data 指 针 回 先行 于 
存储 tail ; 并 且 ， 加 载 tail 先 行 于 加 载 data 指 针 @@， 所 以 对 data 的 存储 要 先行 于 加 载 ， 一 切 都 没 
问题 。 因 此 ， 这 是 一 个 完美 的 单 生产 者 ， 单 消费 者 (SPSC, single-producer, single-consume) 
队列 。 


问题 在 于 当 多 线程 对 push() 或 pop() 并 发 调用 。 先 看 一 下 push() : 如 果 有 两 个 线程 并 发 调用 
push()， 那 么 它们 会 新 分 配 两 个 节点 作为 庶 拟 节点 国 ， 也 会 读 取 到 相同 的 tail 值 @， 因 此 也 会 同 
时 修改 同一 个 节点 ， 同 时 设置 data 和 next 指 针 @@@。 明 显 的 数据 竞争 |! 


pop_head() 驾 数 也 有 类 似 的 问题 。 当 有 两 个 线程 并 发 的 调用 这 个 函数 时 ， 这 两 个 线程 就 会 读 
取 到 同一 个 head 中 同样 的 值 ， 并且 会 同时 通过 next 指 针 去 复写 昌 值 。 两 个 线程 现在 都 能 索引 
到 同一 个 节点 一 一 丨 是 一 场 灾 难 ! 这 里 ， 不 仅 要 保证 只 有 一 个 pop() 线 程 可 以 访问 给 定 项 ， 还 
要 保证 其 他 线程 在 读 取 head 指 针 时 ， 可 以 安全 的 访问 节点 中 的 next。 这 就 和 无 锁 栈 中 pop() 的 
问题 一 样 了 ， 那 么 就 有 很 多 解决 方案 可 以 在 这 里 使 用 。 





pop() 的 问题 解决 了 ， 那 么 push() 呢 ? 问题 在 于 为 了 获取 push() 和 pop() 间 的 先行 关系 ， 就 需要 
在 为 虚拟 节点 设置 数据 项 前 ， 更 新 tail 指 针 。 这 就 意味 着 ， 并 发 访问 push() 时 ， 因 为 每 个 线程 
所 读 取 到 的 是 同一 个 tail 指 针 ， 所 以 线程 会 为 同一 个 数据 项 进行 充 争 。 


多 线程 下 的 push() 


第 一 个 选择 是 在 两 个 监 实 节点 中 添加 一 个 虚拟 节点 。 这 种 方法 ， 需 要 当前 tail 节 点 更 新 next 指 

针 ， 这 样 让 节点 看 起 来 像 一 个 原子 变量 。 当 一 个 线程 成 功 将 next 指 针 指向 一 个 新 节点 ， 就 说 明 
其 成 功 的 添加 了 一 个 指针 ; 否则 ， 就 不 得 不 再 次 读 取 tail， 并 重新 对 指针 进行 添加 。 这 里 就 需 

要 对 pop() 进 行 简单 的 修改 ， 为 了 消除 持 有 空 指针 的 节点 再 次 进行 循环 。 这 个 方法 的 缺点 : 每 

次 pop() 函 数 的 调用 ， 通 常 都 要 删除 两 个 节点 ， 每 次 添加 一 个 节点 ， 都 需要 分 配 双 份 内 存 。 


第 二 个 选择 是 让 data 指 针 原 子 化 ， 并 通过 “比较 /交换 "操作 对 其 进行 设置 。 如 果 "“ 上 比较/ 交换 ?成 
功 ， 就 说 明 你 能 获取 tail 指 针 ， 并 能 够 安全 的 对 其 next 指 针 进 行 设置 ， 也 就 是 更 新 tail。 因 为 有 
其 他 线程 对 数据 进行 了 存储 ， 所 以 会 导致 “比较 /交换 "操作 的 失败 ， 这 时 就 要 重新 读 取 tail， 重 
新 循环 。 当 原子 操作 对 于 std::shared_ptr<> 是 无 锁 的 ， 那 么 就 可 以 轻松 一 下 了 “。 如 果 不 是 ， 
你 就 需要 一 个 替代 方案 了 ; — FP T 48 ÆT pop) AA A std: :unique_ptr<> (毕竟 ， 这 个 
指针 指针 只 能 引用 指定 对 象 )， 并 且 将 数据 作为 一 个 普通 指针 存储 在 队列 中 的 方案 。 这 就 需要 
队列 支持 存储 std::atomic<t*> 类 型 ， 对 于 compare_exchange _strong() 的 调用 就 很 有 必要 
了 。 当 使 用 的 是 类 似 于 清单 7.11 中 的 引用 计数 模式 ， 来 解决 多 线程 对 pop() 和 push() 的 访问 。 


清单 7.14 push() 的 第 一 次 修订 (不 正确 的 ) 


void push(T new_value) 
{ 
std::unique_ptr<T> new_data(new T(new_value)); 
counted_node_ptr new_next; 
new_next.ptr=new node; 
new_next.external_count=1; 
for(;;) 
{ 
node* const old_tail=tail.load(); // 1 
T* old_data=nullptr; 
if(old_tail->data.compare_exchange_strong( 
old_data,new_data.get())) // 2 


old_tail->next=new_next; 
tail.store(new_next.ptr); // 3 
new_data.release(); 

break; 


使 用 引用 计数 方案 可 以 避免 竞争 ， 不 过 竞争 不 只 在 push() 中 。 可 以 再 看 一 下 7.14 中 的 修订 版 
push() ;与 栈 中 模式 相同 : 加 载 一 个 原子 指针 @， 并 且 对 该 指针 解 引用 @@。 同 时 ， 另 一 个 线程 
可 以 对 指针 进行 更 新 国 ， 最 终 回收 该 节点 (在 pop() 中 )。 当 节点 回收 后 ， 再 对 指针 进行 解 引 用 > 
就 对 导致 未 定义 行为 。 啊 哈 ! 这 里 有 个 诱 人 的 方案 ， 就 是 给 tail 也 添加 计数 器 ， 就 像 给 head 做 
的 那样 ， 不 过 队列 中 的 节点 的 next 指 针 中 都 已 经 拥有 了 一 个 外 部 计数 。 在 同一 个 节点 上 有 两 个 
外 部 计数 ， 为 了 避免 过 早 的 删除 节点 ， 这 就 是 对 之 前 引用 计数 方案 的 修改 。 通 过 对 node 结 构 
中 外 部 计数 器 数量 的 统计 ， 解 决 这 个 问题 。 当 外 部 计数 器 销毁 时 ， 统 计 值 减 一 (将 对 应 的 外 部 
计数 添加 到 内 部 )。 当 内 部 计数 是 0， 且 没有 外 部 计数 器 时 ， 对 应 节点 就 可 以 被 安全 删除 了 。 这 
个 技术 ， 是 我 查阅 Joe Seigh 的 原子 指针 + 项 目 [5] 的 时 候 看 到 的 。 下 面 push() 的 实现 就 使 用 的 
就 是 这 种 方案 。 


清单 7.15 使 用 带 有 引用 计数 tail， 实 现 的 无 锁 队 列 中 的 push() 


template<typename T> 
class lock_free_queue 
{ 
private: 
struct node; 
struct counted_node_ptr 


int external_count; 
node* ptr; 


Yy 


std::atomic<counted_node_ptr> head; 
std::atomic<counted_node_ptr> tail; // 1 


struct node_counter 

{ 
unsigned internal_count:30; 
unsigned external_counters:2; // 2 


Y 


struct node 

{ 
std: :atomic<T*> data; 
std: :atomic<node_counter> count; // 3 
counted_node_ptr next; 


node() 

{ 
node_counter new_count; 
new_count.internal_count=0; 
new_count.external_counters=2; // 4 
count.store(new_count); 


next.ptr=nullptr; 
next.external_count=0; 
} 
}; 
public: 
void push(T new_value) 
{ 
std: :unique_ptr<T> new_data(new T(new_value)); 
counted_node_ptr new_next; 
new_next.ptr=new node; 
new_next.external_count=1; 
counted_node_ptr old_tail=tail.load(); 


for(;;) 
{ 


increase_external_count(tail,old_tail); // 5 


T* old_data=nullptr; 
if(old_tail.ptr->data.compare_exchange_strong( // 6 
old_data, new_data.get())) 


old_tail.ptr->next=new_next; 
old_tail=tail.exchange(new_next); 
free_external_counter(old_tail); // 7 
new_data.release(); 

break; 


} 


old_tail.ptr->release_ref(); 


} 
ia 


清单 7.15 中 ，tail 和 head 一 样 都 是 atomic 类 型 @， 并 且 node 结 构 体 中 用 count 成 员 变 量 替换 了 
之 前 的 internal_count@。count 成 员 变 量 包 括 了 internal count 和 外 部 external_ counters 成 员 
@。 注 意 ， 这 里 你 需要 2bit 的 external _counters， 因 为 最 多 就 有 两 个 计数 器 。 因 为 使 用 了 位 
域 ， 所 以 就 将 internal_count 指 定 为 30bit 的 值 ， 就 能 保证 计数 器 的 总 体 大 小 是 32bit。 内 部 计数 
值 就 有 充足 的 空间 来 保证 这 个 结构 体能 放 在 一 个 机 器 字 中 (包括 32 位 和 64 位 平台 )。 重 要 的 是 ， 
为 的 就 是 避免 条 件 竞 争 ， 将 结构 体 作 为 一 个 单独 的 实体 来 更 新 。 让 结构 体 的 大 小 保持 在 一 个 
机 器 字 内 ， 对 其 的 操作 就 如 同 原子 操作 一 样 ， 还 可 以 在 多 个 平台 上 使 用 。 


node 初 始 化 时 ，internal_ count 设置 为 0，external_ counter 设置 为 2@， 因 为 当 新 节点 加 入 队 
列 中 时 ， 都 会 被 tail 和 上 一 个 节点 的 next 指 针 所 指向 。push() 与 清单 7.14 中 的 实现 很 相似 ， 除 
了 为 了 对 tail 中 的 值 进 行 解 引 用 ， 需 要 调用 节点 data 成 员 变量 的 compare_exchange _strong() 
成 员 函 数 @@ 保 证 值 的 正确 性 ; 在 这 之 前 还 要 调用 increase_external_count() 增 加 计数 器 的 计数 
回 ， 而 后 在 对 尾部 的 日 值 调用 free_external _counter()OD。 


push() 处 理 完毕 ， 再 来 看 一 下 pop()。 下 面 的 实现 ， 是 将 清单 7.11 中 的 引用 计数 pop() 与 7.13 中 
队列 弹出 pop() 混 合 的 版 本 。 


清单 7.16 使 用 尾部 引用 计数 ， 将 节点 从 无 锁 队 列 中 弹出 


template<typename T> 
class lock_free_queue 
{ 
private: 
struct node 
{ 
void release_ref(); 
J; 
public: 
std::unique_ptr<T> pop() 
{ 
counted_node_ptr 
old_head=head.load(std::memory_order_relaxed); // 1 
for(;;) 
{ 
increase_external_count(head,old_head); // 2 
node* const ptr=old_head.ptr; 
if(ptr==tail.load().ptr) 
{ 
ptr->release_ref(); // 3 
return std::unique_ptr<T>(); 
} 
if(head.compare_exchange_strong(old_head,ptr->next)) // 4 
{ 
T* const res=ptr->data.exchange(nullptr); 
free_external_counter(old_head); // 5 
return std::unique_ptr<T>(res)j; 
} 
ptr->release_ref(); // 6 


} 
po 


在 进入 循环 ， 并 将 加 载 值 的 外 部 计数 增加 @ 之 前 ， 需 要 加 载 old_head 值 作为 启动 @。 当 head 
与 tail 节 点 相同 的 时 候 ， 就 能 对 引用 进行 释放 四 ， 因 为 这 时 队列 中 已 经 没有 数据 ， 所 以 返回 的 
是 空 指针 。 如 果 队 列 中 还 有 数据 ， 可 以 尝试 使 用 compare_exchange _strong() 来 做 声明 @。 与 
7.11 中 的 栈 一 样 ， 将 外 部 计数 和 指针 做 为 一 个 整体 进行 比较 的 ; 当 外 部 计数 或 指针 有 所 变化 
时 ， 需 要 将 引用 释放 后 ， 再 次 进行 循环 @@。 当 交换 成 功 时 ， 已 声明 的 数据 就 归 你 所 有 ， 那 么 为 


已 弹出 节点 释放 外 部 计数 后 回 ， 就 能 把 对 应 的 指针 返回 给 调用 函数 了 。 当 两 个 外 部 引用 计数 都 
被 释放 ， 且 内 部 计数 降 为 0 时 ， 节 点 就 可 以 被 删除 。 对 应 的 引用 计数 函数 将 会 在 7.17,7.18 和 
7.19 中 展示 。 


清单 7.17 在 无 锁 队 列 中 释放 一 个 节点 引用 


template<typename T> 
class lock_free_queue 
{ 
private: 
struct node 
{ 
void release_ref() 
{ 
node_counter old_counter= 
count.load(std::memory_order_relaxed); 
node_counter new_counter; 
do 
{ 
new_counter=old_counter; 
--new_counter.internal_count; // 1 
} 
while(!count.compare_exchange_strong( // 2 
old_counter,new_counter, 


std: :memory_order_acquire, std: :memory_order_relaxed)); 
if(!new_counter.internal_count && 
!new_counter.external_counters) 


delete this; // 3 


a 


node::release_ref() 的 实现 ， 只 是 对 7.11 中 |lock_free_stack::pop() 进 行 小 幅度 的 修改 得 到 。 不 
过 ，7.11 中 的 代码 仅 是 处 理 单个 外 部 计数 的 情况 ， 所 以 想 要 修改 internal _count@， 只 需要 使 
用 fetch_sub 就 能 让 count 结 构 体 自动 更 新 。 因 此 ， 需 要 一 个 “比较 /交换 "循环 @。 降 低 

internal _count 时 ， 在 内 外 部 计数 都 为 0 时 ， 就 代表 这 是 最 后 一 次 引用 ， 之 后 就 可 以 将 这 个 节点 
删除 @@。 


清单 7.18 从 无 锁 队 列 中 获取 一 个 节点 的 引用 


template<typename T> 
class lock_free_queue 
{ 
private: 
static void increase_external_count( 
std: :atomic<counted_node_ptr>& counter, 
counted_node_ptr& old_counter) 


counted_node_ptr new_counter; 
do 
{ 
new_counter=old_counter; 
++new_counter.external_count; 
} 
while(!counter.compare_exchange_strong( 
old_counter,new_counter, 
std: :memory_order_acquire, std: :memory_order_relaxed) ); 


old_counter.external_count=new_counter.external_count; 


} 
}; 


清单 7.18 展 示 的 是 另 一 方面 。 这 次 ， 并 不 是 对 引用 的 释放 ， 会 得 到 一 个 新 引用 ， 并 增加 外 部 
计数 的 值 。increase_external_count() 和 7.12 中 的 increase_head count() 很 相似 ， 不 同 的 是 
increase_external _count() 这 里 作为 静态 成 员 函 数 ， 通 过 将 外 部 计数 器 作为 第 一 个 参数 传 入 函 
数 ， 对 其 进行 更 新 ， 而 非 只 操作 一 个 国定 的 计数 器 。 


清单 7.19 无 锁 队 列 中 释放 节点 外 部 计数 器 


template<typename T> 
class lock_free_queue 
{ 
private: 
static void free_external_counter(counted_node_ptr 
&old_node_ptr) 
{ 
node* const ptr=old_node_ptr.ptr; 
int const count_increase=old_node_ptr.external_count-2; 


node_counter old_counter= 
ptr->count.load(std::memory_order_relaxed); 

node_counter new_counter; 

do 

{ 
new_counter=old_counter; 
--new_counter.external_counters; // 1 
new_counter.internal_count+=count_increase; // 2 

} 

while(!ptr->count.compare_exchange_strong( // 3 

old_counter,new_counter, 


std: :memory_order_acquire, std: :memory_order_relaxed)); 


if(!new_counter.internal_count && 
!new_counter.external_counters) 


delete ptr; // 4 


} 
jr 


与 increase_external_count() 对 应 的 是 free_external_counter()°。 这 里 的 代码 和 7.11 中 的 
lock_free_stack::pop() 类 似 ， 不 过 做 了 一 些 修 改 用 来 处 理 external_counters 计 数 。 使 用 单个 
compare_exchange_strong() 对 计数 结构 体 中 的 两 个 计数 器 进行 更 新 加 MRA 
release_ref() 降 低 internal_count 一 样 。 和 7.11 中 一 样 ，internal_count 会 进行 更 新 四， 并 且 
external_counters 将 会 减 一 四。 当 内 外 计数 值 都 为 0， 就 没有 更 多 的 节点 可 以 被 引用 ， 所 以 节 


点 就 可 以 安全 的 删除 @。 这 个 操作 需要 作为 独立 的 操作 来 完成 (因此 需要 "比较 /交换 "循环 )， 来 
避免 条 件 竞争 。 如 果 将 两 个 计数 器 分 开 来 更 新 ， 在 两 个 线程 的 情况 下 ， 可 能 都 会 认为 自己 最 
后 一 个 引用 者 ， 从 而 将 节点 删除 ， 最 后 导致 未 定义 行为 。 


虽然 现在 的 队列 工作 正常 ， 且 无 竞争 ， 但 是 还 是 有 一 个 性 能 问题 。 当 一 个 线程 对 old_tail.ptr- 
>data 成 功 的 完成 compare_exchange_strong()(7.15 中 的 @)， 就 可 以 执行 push() 操 作 ; 并 且 ， 
能 确定 没有 其 他 线程 在 同时 执行 push() 操 作 。 这 里 ， 让 其 他 线程 看 到 有 新 值 的 如 入 ， 要 比 只 看 
到 空 指针 的 好 ， 因 此 在 compare_exchange_strong() 调 用 失败 的 时 候 ， 线 程 就 会 继续 循环 。 这 
就 是 忙 等 待 ， 这 种 方式 会 消耗 CPU 的 运算 周期 ， 且 什么 事情 都 没 做 。 因 此 ， 忙 等 待 这 就 是 一 
个 锁 。push() 的 首次 调用 ， 是 要 在 其 他 线程 完成 后 ， 将 阻塞 去 除 后 才能 完成 ， 所 以 这 里 的 实现 
只 是 半 无 锁 (no longer lock-free) 结 构 。 不 仅 如 此 ， 还 有 当 线 程 被 阻塞 的 时 候 ， 操 作 系 统 会 给 
不 同 的 线程 以 不 同 优先 级 ， 用 于 获取 互 斥 锁 。 在 当前 情况 下 ， 不 可 能 出 现 不 同 优先 级 的 情 

况 ， 所 以 阻塞 线程 将 会 浪费 CPU 的 运算 周期 ， 直 到 第 一 个 线程 完成 其 操作 。 处 理 的 技巧 出 自 
于 “无 锁 技巧 包 ”: 等 待 线程 可 以 帮助 push() 线 程 完成 操作 。 


无 锁 队 列 中 的 线程 间 互 助 


为 了 恢复 代码 无 锁 的 属性 ， 就 需要 让 等 待 线 程 ， 在 push() 线 程 没什么 进展 时 ， 做 一 些 事 情 ， 就 
是 帮 进 展 缓慢 的 线程 完成 其 工作 。 


在 这 种 情况 下 ， 可 以 知道 线程 应 该 去 做 什么 : 尾 节点 的 next 指 针 需 要 指向 一 个 新 的 虚拟 节点 ， 
且 tail 指 针 之 后 也 要 更 新 。 因 为 虚拟 节点 都 是 一 样 的 ， 所 以 是 谁 创 建 的 都 不 重要 。 当 将 next 指 

针 放 入 一 个 原子 节点 中 时 ， 就 可 以 使 用 compare_exchange_strong() 来 设置 hext 指 针 。 当 next 
指针 已 经 被 设置 ， 就 可 以 使 用 compare_exchange_weak() 循 环 对 tail 进 行 设置 ， 能 保证 next 指 
针 始 终 引 用 的 是 同一 个 原始 节点 。 如 果 引 用 的 不 是 同一 个 原始 节点 ， 那 么 其 他 部 分 就 已 经 更 

新 ， 可 以 停止 尝试 再 次 循环 。 这 个 需求 只 需要 对 pop() 进 行 微小 的 改动 ， 其 目的 就 是 为 了 加 载 
next 指 针 ; 这 个 实现 将 在 下 面 展示 。 


清单 7.20 修改 pop() 用 来 帮助 push() 完 成 工作 


template<typename T> 


class 


{ 


lock_free_queue 


private: 


struct node 


std: :atomic<T*> data; 
std: :atomic<node_counter> count; 


std::atomic<counted_node_ptr> next; // 1 


la 


public: 


std: 


i 


:unique_ptr<T> pop() 


counted_node_ptr 


old_head=head.load(std::memory_order_relaxed) ; 
for(;;) 


{ 


} 
ty 


increase_external_count(head,old_head); 
node* const ptr=old_head.ptr; 
if(ptr==tail.load().ptr) 
{ 
return std::unique_ptr<T>(); 
} 
counted_node_ptr next=ptr->next.load(); // 2 
if(head.compare exchange_strong(old_head, next)) 
{ 
T* const res=ptr->data.exchange(nullptr); 
free_external_counter(old_head); 
return std::unique_ptr<T>(res); 
} 


ptr->release_ref(); 


如 之 前 所 说 ’ 改变 很 简单 : next 指 针线 程 就 是 原子 的 @ ’ Pr VAload@ +a x JR F 9 a 在 这 个 例子 
中 ， 可 以 使 用 默认 memory_order seq_cst 内 存 序 ， 所 以 这 里 可 以 忽略 对 load() 的 显 式 调 用 ， 
并 且 依赖 于 加 载 对 象 隐 式 转 换 成 counted_node_ptr， 不 过 这 里 的 显 式 调用 就 可 以 用 来 提醒 : 
哪里 需要 显 式 添加 内 存 序 。 


以 下 代码 对 push() 有 更 多 的 展示 。 


清单 7.21 无 锁 队 列 中 简单 的 帮助 性 push() 的 实现 


template<typename T> 
class lock_free_queue 
{ 
private: 
void set_new_tail(counted_node_ptr &old_tail, // 1 
counted_node_ptr const &new_tail) 


node* const current_tail_ptr=old_tail.ptr; 
while(!tail.compare_exchange_weak(old_tail,new_tail) && 


2 
old_tail.ptr==current_tail_ptr); 
if(old_tail.ptr==current_tail_ptr) // 3 
free_external_counter(old_tail); // 4 
else 
current_tail_ptr->release_ref(); // 5 
} 
public: 


void push(T new_value) 

{ 
std: :unique_ptr<T> new_data(new T(new_value)); 
counted_node_ptr new_next; 
new_next.ptr=new node; 
new_next.external_count=1; 
counted_node_ptr old_tail=tail.load(); 


for(;;) 
{ 


increase_external_count(tail,old_tail); 


T* old_data=nullptr; 
if(old_tail.ptr->data.compare_exchange_strong( // 6 
old_data, new_data.get())) 


counted_node_ptr old_next={0}; 
if(!old_tail.ptr->next.compare_exchange_strong( // 7 
old_next, new_next ) ) 


delete new_next.ptr; // 8 
new_next=old_next; // 9 
} 
set_new_tail(old_tail, new_next); 
new_data.release(); 


break; 
} 
else // 10 
{ 
counted_node_ptr old_next={0}; 
if(old_tail.ptr->next.compare_exchange_strong( // 11 
old_next, new_next)) 
{ 
old_next=new_next; // 12 
new_next.ptr=new node; // 13 
} 
set_new_tail(old_tail, old_next); // 14 
} 
} 


} 
}; 


与 清单 7.15 中 的 原始 push() 相 似 ， 不 过 还 是 有 些 不 同 。 当 对 data 进 行 设置 回 ， 就 需要 对 另 一 线 
程 帮忙 的 情况 进行 处 理 ， 在 else 分 支 就 是 具体 的 帮助 四 。 


对 节点 中 的 data 指 针 进 行 设置 @ 时 ， 新 版 push() 对 next 指 针 的 更 新 使 用 的 是 
compare_exchange_strong()@( 这 里 使 用 compare_exchange_strong() 来 避免 循环 ), 当 交换 失 
败 ， 就 能 知道 另 有 线程 对 next 指 针 进 行 设 置 ， 所 以 就 可 以 删除 一 开始 分 配 的 那个 新 节点 轿 。 还 
需要 获取 next 指 向 的 值 一 一 其 他 线程 对 tail 指 针 设 置 的 值 。 


对 tail 指 针 的 更 新 ， 实 际 在 set_ new _tail() 中 完成 @。 这 里 使 用 一 个 compare_exchange_weak() 
循环 @ 来 更 新 tail， 如 果 其 他 线程 尝试 push() 一 个 节点 时 ，external_count 部 分 将 会 改变 。 不 

过 ， 当 其 他 线程 成 功 的 修改 了 tail 指 针 时 ， 就 不 能 对 其 值 进 行 替换 ; 否则 ， 队 列 中 的 循环 将 会 
结束 ， 这 是 一 个 相当 糟糕 的 主意 。 因 此 ， 当 “比较 /交换 "操作 失败 的 时 候 ， 就 需要 保证 ptr 加 载 
值 要 与 tail 指 向 的 值 相 同 。 当 新 旧 ptr 相 同时 ， 循 环 退 出 国 ， 这 就 代表 对 tail 的 设置 已 经 完成 ， 所 
以 需要 释放 上 日 外 部 计数 器 @。 当 ptr 值 不 一 样 时 ， 那 么 另 一 线程 可 能 已 经 将 计数 器 释放 了 ， 所 
以 这 里 只 需要 对 该 线程 持 有 的 单 次 引用 进行 释放 即 可 加 © 

当 线 程 调用 push() 时 ， 未 能 在 循环 阶段 对 data 指 针 进 行 设置 ， 那 么 这 个 线程 可 以 帮助 成 功 的 线 
程 完成 更 新 。 首 先 ， 会 尝试 更 新 next 指 针 ， 让 其 指向 该 线程 分 配 出 来 的 新 节点 4D。 当 指针 更 新 
成 功 ， 就 可 以 将 这 个 新 节点 作为 新 的 tail 节 点 (9， 且 需要 分 配 另 一 个 新 节点 ， 用 来 管理 队列 中 


新 推送 的 数据 项 43。 在 再 进入 循环 之 前 ， 可 以 通过 调用 set_new_tail 来 设置 tail 节 点 (4D。 


读者 可 能 已 经 意识 到 ， 比 起 大 量 的 new 和 delete 操 作 ， 这 样 的 代码 更 加 和 短小精悍， 因为 新 节点 
实在 push() 中 被 分 配 ， 而 在 pop() 中 被 销毁 。 因 此 ， 内 存 分 配器 的 效率 也 需要 考虑 到 ; —D 
糕 的 分 配器 可 能 会 让 无 锁 容器 的 扩展 特性 消失 的 一 干 二 净 。 选 择 和 实现 高 效 的 分 配器 ， 已 经 
超出 了 本 书 的 范围 ， 不 过 需要 牢记 的 是 : 测试 以 及 衡量 分 配器 效率 最 好 的 办 法 ， 就 是 对 使 用 
前 和 使 用 后 进行 比较 。 为 优化 内 存 分 配 ， 包 括 每 个 线程 有 自己 的 分 配器 ， 以 及 使 用 回收 列表 
对 节点 进行 回收 ， 而 非 将 这 些 节点 返回 给 分 配器 。 


例子 已 经 足够 多 了 ; 那么 ， 让 我 们 从 这 些 例子 中 提取 出 一 些 指 导 建 议 吧 。 
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7.3 对 于 设计 无 锁 数 据 结 构 的 指导 建议 


本 章 中 的 例子 中 ， 看 到 了 一 些 复 杂 的 代码 可 让 无 锁 结构 工作 正常 。 如 果 要 设计 自己 的 数据 结 
构 ， 一 些 指导 建议 可 以 帮助 你 找到 设计 重点 。 第 6 章 中 关于 并 发 通用 指导 建议 还 适用 ， 不 过 这 
里 需要 更 多 的 建议 。 我 从 例子 中 抽取 了 几 个 实用 的 指导 建议 ， 在 你 设计 无 锁 结 构 数 据 的 时 候 
就 可 以 直接 引用 。 


7.3.1 指导 建议 : 使 
用 std: :memory_order_seq_cst 的 原型 


std: :memory_order_seq_cst 比 起 其 他 内 存 序 要 简 单 的 多 7 A 所 有 操作 都 将 其 作为 总 序 ° 本 
章 的 所 有 例子 ， 都 是 从 std: :memory_order_seq_cst 开始 ， 只 有 当 基 本 操作 正常 工作 的 时 候 ， 

才 放 宽 内 存 序 的 选择 。 在 这 种 情况 下 ， 使 用 其 他 内 存 序 就 是 进行 优化 (早起 可 以 不 用 这 样 做 ) 。 
通常 ， 当 你 看 整套 代码 对 数据 结构 的 操作 后 ， 才 能 决定 是 否 要 放宽 该 操作 的 内 存 序 选择 。 所 
以 ， 尝 试 放宽 选择 ， 可 能 会 让 你 轻松 一 些 。 在 测试 后 的 时 候 ， 工 作 的 代码 可 能 会 很 复杂 (不 

过 ， 不 能 完全 保证 内 存 序 正确 )。 除非 你 有 一 个 算法 检查 器 ， 可 以 系统 的 测试 ， 线 程 能 看 到 的 
所 有 可 能 性 组 合 ， 这 样 就 能 保证 指定 内 存 序 的 正确 性 (这 样 的 测试 的 确 存在 )， 仅 是 执行 实现 代 
码 是 远 远 不 够 的 。 


7.3.2 指导 建议 : 对 无 锁 内 存 的 回收 策略 


这 里 与 无 锁 代码 最 大 的 区 别 就 是 内 存 管理 。 当 有 其 他 线程 对 节点 进行 访问 的 时 候 ， 节 点 无 法 
被 任 一 线程 删除 ; 为 避免 过 多 的 内 存 使 用 ， 还 是 希望 这 个 节点 在 能 删除 的 时 候 尽快 删除 。 本 
章 中 介绍 了 三 种 技术 来 保证 内 存 可 以 被 安全 的 回收 : 


o 等 待 无 线程 对 数据 结构 进行 访问 时 ， 删 除 所 有 等 待 删除 的 对 象 。 
o 使 用 风险 指针 来 标识 正在 被 线程 访问 的 对 象 。 
e 对 对 象 进 行 引 用 计数 ， 当 没有 线程 对 对 象 进行 引用 时 ， 将 其 删除 。 


在 所 有 例子 中 ， 主 要 的 想法 都 是 使 用 一 种 方式 去 跟踪 指定 对 象 上 的 线程 访问 数量 ， 当 没有 现 
成 对 对 象 进 行 引 用 的 时 候 ， 将 对 象 删除 。 当然 ， 在 无 锁 数 据 结构 中 ， 还 有 很 多 方式 可 以 用 来 
回收 内 存 。 例 如 ， 理 想 情 况 下 使 用 一 个 垃圾 收集 器 。 比 起 算法 来 说 ， 其 实现 更 容 多 一 些 。 只 
需要 让 回收 器 知道 ， 当 节点 没 被 引用 的 时 候 ， 回 收 节点 ， 就 可 以 了 。 


其 他 替代 方案 就 是 循环 使 用 节点 ， 只 在 数据 结构 被 销毁 的 时 候 才 将 节点 完全 删除 。 因 为 节点 
能 被 复 用 ， 那 么 就 不 会 有 非法 的 内 存 ， 所 以 这 就 能 避免 未 定义 行为 的 发 生 。 这 种 方式 的 缺 
点 : 产生 “ABA 问 题 ”。 


7.3.3 指导 建议 : 小 心 ABA 问 题 


在 “基于 比较 /交换 ?的 莫 法 中 要 格外 小 心 “ABA 问 题 *。 其 流程 是 


1. TER 并 且 发 现 其 值 是 A。 

2. 线程 1 对 这 个 值 进 行 一 些 操作 ， 比 如 ， 解 引用 ( 当 其 是 一 个 指针 的 时 候 )， 或 做 查询 ， 或 其 
他 操作 。 

.操作 系统 将 线程 1 挂 起 。 

4. 其 他 线程 对 x 执行 一 些 操 作 ， 并 且 将 其 值 改 为 B。 

5， 另 一 个 线程 对 A 相关 的 数据 进行 修改 (线程 1 持 有 )， 让 其 不 再 合法 。 可 能 会 在 释放 指针 指向 
的 内 存 时 ， 代 码 产生 剧烈 的 反应 (大 问题 ) ; 或 者 只 是 修改 了 相关 值 而 已 (小 问题 )。 

6. 再 来 一 个 线程 将 x 的 值 改 回 为 人 A。 如 果 人 A 是 一 个 指针 ， 那 么 其 可 能 指向 一 个 新 的 对 象 ， 只 是 
与 日 对 象 共 享 同一 个 地 址 而 已 。 


7. 线程 1 继续 运行 ee 比较 /交换 "操作 ， 将 人 进行 对 比 。 这 里 ，“ 比 较 /交换 ”成 功 
Saas e A)， 不 过 这 是 一 个 错误 的 Althe wrong Avalue)。 从 第 2 步 中 读 取 的 数据 不 
再 合法 ， 但 是 线程 ae 明 这 个 问题 ， 并 且 之 后 的 操作 将 会 损坏 数据 结构 。 


本 章 提 到 的 算法 不 存在 这 个 问题 ， 不 过 在 无 锁 的 算法 中 ， 这 个 问题 很 常见 。 解 决 这 个 问题 的 
一 般 方 法 是 ， 让 变量 x 中 包含 一 个 ABA 计 数 器 。“ 比 较 / 交 换 ”" 会 对 加 入 计数 器 的 x 作 。 每 
次 的 值 都 不 一 样 ， 计 数 随 之 增长 ， 所 以 在 x 还 是 原 值 的 前 提 下 ， 即 使 有 线程 对 x 
较 /交换 ?还 是 会 失败 。 


进行 
进行 


=} 
Or 
& 
E 
N 
Ra 
ad 
TA 
EN 
ans 
= 
a 


“ABA 问 题 "在 使 用 释放 链表 和 循环 使 用 节点 的 算法 中 很 是 普遍 ， 而 将 
会 引起 这 个 问题 。 


7.3.4 指导 建议 : 识别 忙 等 待 循环 和 帮助 其 他 线程 


在 最 终 队 列 的 例子 中 ， 已 经 见识 到 线程 在 执行 push 操 作 时 ， 必 须 等 待 另 一 个 push 操 作 流 程 的 
完成 。 等 待 线程 就 会 被 孤立 ， 将 会 陷入 到 忙 等 待 循环 中 ， 当 线程 党 试 失 败 的 时 候 ， 会 继续 特 
环 ， 这 样 就 会 浪费 CPU 的 计算 周期 。 当 忙 等 待 循环 结束 时 ， 就 像 一 个 阻塞 操作 解除 ， 和 使 用 

互 矿 锁 的 行为 一 样 。 通 过 对 算法 的 修改 ， 当 之 前 的 线程 还 没有 完成 操作 前 ， 让 等 待 线 程 执行 
未 完成 的 步骤 ， 就 能 让 忙 等 待 的 线程 不 再 被 阻塞 。 在 队列 例 中 ， 需 要 将 一 个 数据 成 员 转 换 为 
一 个 原子 变量 ， 而 不 是 使 用 非 原 子 变 量 和 使 用 "比较 /交换 ?操作 来 做 这 件 事 ; 要 是 在 更 加 复杂 
的 数据 结构 中 ， 这 将 需要 更 加 多 的 变化 来 满足 需求 。 


7.4 本 章 总 结 


从 第 6 章 中 的 基于 锁 的 数据 结构 起 ， 本 章 简 要 的 描述 了 一 些 无 锁 数 据 结构 的 实现 (通过 实现 栈 和 
队列 )。 在 这 个 过 程 中 ， 需 要 小 心 使 用 原子 操作 的 内 存 序 ， 为 了 保证 无 数据 竞争 ， 以 及 让 每 个 
线程 看 到 一 个 预制 相关 的 数据 结构 。 也 能 了 解 到 ， 在 无 锁 结 构 中 对 内 存 的 管理 是 越 来 越 难 。 
还 有 ， 如 何 通过 帮助 线程 的 方式 ， 来 避免 忙 等 待 循环 。 


设计 无 锁 数 据 结构 是 一 项 很 困难 的 任务 ， 并 且 很 容易 犯错 ; 不 过 ， 这 样 的 数据 结构 在 某 些 重 
要 情况 下 可 对 其 性 能 进行 扩展 。 但 愿 ， 通 过 本 章 的 的 一 些 例子 ， 以 及 一 些 指 导 意见 ， 可 以 帮 
助 你 设计 出 自己 的 无 锁 数 据 结 构 ， 或 是 实现 一 份 研究 报告 中 的 数据 结构 ， 或 用 以 发 现 离职 同 
事 代码 中 的 bug。 


不 管 在 线程 间 共 享 怎么 样 的 数据 ， 你 需要 考虑 数据 结构 如 何 使 用 ， 并 且 怎 么 样 在 线程 间 同 步 
着 重 于 对 数据 的 执行 ， 而 非 数 据 的 同步 。 你 将 会 在 第 8 章 中 看 到 类 似 的 行为 : 将 并 发 数据 结构 


转 为 一 般 的 并 发 代码 。 并 行 算法 是 使 用 多 线程 的 方式 提高 性 能 ， 因 为 算法 需要 工作 线程 共享 
它们 的 数据 ， 所 以 对 并 发 数据 结构 的 选择 就 很 关键 了 。 


第 8 章 并 发 代码 设计 
本 章 主要 内 容 


。 线程 问 划分 数据 的 技术 

。 影响 并 发 代码 性 能 的 因素 

。 性 能 因素 是 如 何 影响 数据 结构 的 设计 
。 多 线程 代码 中 的 异常 安全 

。 可 扩展 性 

。 并 行 算法 的 实现 


之 前 章节 着 重 于 介绍 使 用 cH 11 中 的 新 工具 来 写 并 发 代码 。 在 第 6、7 章 中 我 们 了 解 到 ， 如 何 
使 用 这 些 工 具 来 设计 可 并 发 访问 的 基本 数据 结构 。 这 就 好 比 一 个 木匠 ， 其 不 仅 要 知道 如 何 做 
一 个 合 页 ， 一 个 组 合 柜 ， 或 一 个 桌子 ; 并 发 的 代码 的 使 用 ， 要 比 使 用 /设计 基本 数据 结构 频繁 
的 多 。 要 将 眼界 放宽 ， 就 需要 构建 更 大 的 结构 ， 进 行 高 效 的 工作 。 我 将 使 用 多 线程 化 

的 c++ 标准 库 算法 作为 例子 ， 不 过 这 里 的 原则 也 适用 于 对 其 他 应 用 程序 的 扩展 。 


认 站 思考 如 何 进行 并 发 化 设计 ， 对 于 每 个 编程 项 目 来 说 都 很 重要 。 不 过 ， 写 多 线程 代码 的 时 
候 ， 需 要 考虑 的 因素 比 写 序 列 化 代码 多 得 多 。 不 仅 包 括 一 般 性 因素 ， 例 如 : HR BSR 
合 (这 些 在 很 多 软件 设计 书籍 中 有 很 详细 的 介绍 )， 还 要 考虑 哪些 数据 需要 共享 ， 如 何 同步 访问 
数据 ， 哪 些 线程 需要 等 待 哪些 线程 ， 等 等 。 


本 章 将 会 关注 这 些 问 题 ， 从 高 层 (但 也 是 基本 的 ) 考 虑 ， 如 何 使 用 线程 ， 哪 些 代 码 应 该 在 哪些 线 
程 上 执行 ; 以 及 ， 这 将 如 何 影响 代码 的 清晰 度 ， 并 从 底层 细节 上 了 解 ， 如 何 构 建 共 享 数据 来 
优化 性 能 。 


那么 就 先 来 看 一 下 ， 如 何在 线程 间 划 分 工作 。 


8.1 线程 间 划 分 工作 的 技术 


试想 ， 你 被 要 求 负责 建造 一 座 房子 。 为 了 完成 任务 ， 你 需要 挖 地 基 、 砌 墙 、 添 加 水 上 暖 、 接 入 
电线 ， 等 等 。 理 论 上 ， 如 果 你 很 擅长 建造 屋子 ， 那 么 这 些 事情 都 可 以 由 你 来 完成 ， 但 是 这 样 
就 要 花费 很 长 很 长 时 间 ， 并 且 需 要 不 断 的 切换 任务 。 或 者 ， 你 可 以 雇佣 一 些 人 来 帮助 你 完成 
房子 的 建造 。 那 么 现在 你 需要 决定 雇 多 少 人 ， 以 及 雇佣 人 员 具 有 什么 样 的 技能 。 比 如 ， 你 可 
以 雇 几 个 人 ， 这 几 个 人 什么 都 会 。 现 在 你 还 得 不 断 的 切换 任务 ， 不 过 因为 雇佣 了 很 多 人 ， 就 
要 比 之 前 的 速度 快 很 多 。 


或 者 ， 你 可 以 雇佣 一 个 包工 队 (专家 组 )， 由 瓦工 ， 木 区， 电工 和 水 管 工 组 成 。 你 的 包工 队员 只 
做 其 擅长 的 ， 所 以 当 没有 水 暖 任务 时 ， 水 管 工会 坐 在 那里 休息 ， 喝 茶 或 咖啡 。 因 为 人 多 的 缘 
故 ， 要 比 之 前 一 个 人 的 速度 快 很 多 ， 并 且 水 管 工 在 收拾 而 所 的 时 候 ， 电 工 可 以 将 电线 连接 到 
厨房 ， 不 过 当 没 有 属于 自己 的 任务 时 ， 有 人 就 会 休息 。 即 使 有 人 在 休息 ， 你 可 能 还 是 能 感觉 
到 包工 队 要 比 雇佣 一 群 什么 都 会 的 人 快 。 包 工 队 不 需要 更 换 工 具 ， 并 且 每 个 人 的 任务 都 要 比 
会 的 人 做 的 快 。 是 快 还 是 慢 ， 取 决 于 特定 的 情况 一 一 需要 尝试 ， 进 行 观察 。 





即使 雇佣 包工 队 ， 你 依旧 可 以 选择 人 数 不 同 的 团队 (可 能 在 一 个 团队 中 ， 瓦 工 的 数量 超过 电 
工 )。 同 样 ， 这 会 是 一 种 补足 ， 并 且 在 建造 不 止 一 座 房子 的 时 候 ， 会 改变 整体 效率 。 即 使 水 管 
工 没有 太 多 的 任务 ， 在 建造 过 一 次 房子 后 ， 你 依旧 能 让 他 总 是 处 于 忙 原 的 状态 。 当 包工 队 无 
事 可 做 的 时 候 ， 你 是 不 会 给 他 们 钱 的 ; 即使 每 次 工作 只 有 那么 几 个 人 工作 ， 你 还 需要 负担 整 
个 团队 的 开销 。 


建造 例子 已 经 足够 说 明 问 题 ; 这 与 线程 所 做 的 事情 有 什么 关系 呢 ? 好 吧 ， 这 些 问 题 也 会 发 生 
在 线程 上 。 你 需要 决定 使 用 多 少 个 线程 ， 并 且 这 些 线程 应 该 去 做 什么 。 还 需要 决定 是 使 用 “全 
能 "的 线程 去 完成 所 有 的 任务 ， 还 是 使 用 “专业 ”线程 只 去 完成 一 件 事情 ， 或 将 两 种 方法 混合 。 
使 用 并 发 的 时 候 ， 需 要 作出 诸多 选择 来 驱动 并 发 ， 这 里 的 选择 会 决定 代码 的 性 能 和 清晰 度 。 
因此 ， 这 里 的 选择 至 关 重 要 ， 所 以 在 你 设计 应 用 程序 的 结构 时 ， 再 作出 适当 的 决定 。 在 本 节 
中 ， 将 看 到 很 多 划分 任务 的 技术 ， 就 先 从 线程 间 划 分 数据 开始 吧 ! 


8.1.1 在 线程 处 理 前 对 数据 进行 划分 


最 简单 的 并 行 算法 > 就 是 并 行 化 的 std::for_each ， 其 会 对 一 个 数据 集中 每 个 元 素 执 行 同 一 个 
操作 。 为 了 并 行 化 该 算法 ， 可 以 为 数据 集中 每 个 元 素 分 配 一 个 处 理 线程 。 如 何 划 分 才能 获得 
最 佳 的 性 能 ， 很 大 程度 上 取决 于 数据 结构 实现 的 细节 ， 在 之 后 有 关 性 能 问题 的 章节 会 再 提 及 
此 问题 。 


最 简单 的 分 配方 式 : 第 一 组 N 个 元 素 分 配 一 个 线程 ， 下 一 组 N 个 元 素 再 分 配 一 个 线程 ， 以 此 类 


推 ， 如 图 8.1 所 示 。 不 管 数据 怎么 分 ， 每 个 线程 都 会 对 分 配给 它 的 元 素 进行 操作 ， 不 过 并 不 会 
和 其 他 线程 进行 沟通 ， 直 到 处 理 完成 。 


-r rm CA 


Thread 1 Thread 2 Thread m 


图 8.1 向 线程 分 发 连续 的 数据 块 


使 用 过 MPI(Message Passing Interface)[1] 和 OpenMP[2] 的 人 对 这 个 结构 一 定 很 熟悉 : 一 项 任 
务 被 分 割 成 多 个 ， 放 入 一 个 并 行 任务 集中 ， 执 行 线程 独立 的 执行 这 些 任 务 ， 结 果 在 会 有 主线 
程 中 合并 。 这 种 方式 在 2.4 节 中 的 accumulate 的 例子 中 使 用 过 了 ; 在 这 个 例子 中 ， 所 有 并 行 任 
务 和 主线 程 的 任务 都 是 累加 和 “。 对 于 for each 来 说 ， 主 线程 将 无 事 可 做 ， 因 为 这 个 计算 不 需要 
最 终 处 理 。 


最 后 一 步 对 于 并 行程 序 来 说 十 分 重要 ; 如 清单 2.8 中 那样 原始 的 实现 ， 最 后 一 步 就 是 一 个 串 行 
的 。 不 过 ， 这 一 步 同 样 也 是 能 被 并 行 化 的 ; accumulate 实 际 上 是 一 个 递减 操作 ， 所 以 清单 2.8 
中 ， 当 线程 数量 大 于 一 个 线程 上 最 小 处 理 项 时 ， 可 以 对 accumulate 进 行 递归 调用 。 或 者 ， 工 
作 线 程 就 像 做 一 个 完整 的 任务 一 样 ， 对 步骤 进行 递减 ， 而 非 每 次 都 产生 新 的 线程 。 


虽然 这 个 技术 十 分 强大 ， 但 是 并 不 是 哪 都 适用 。 有 时 不 能 像 之 前 那样 ， 对 任务 进行 整齐 的 划 
分 ， 因 为 只 有 对 数据 进行 处 理 后 ， 才 能 进行 明确 的 划分 。 这 里 特别 适用 了 递归 算法 ， 就 像 快 
速 排序 ; 下 面 就 来 看 看 这 种 特别 的 方式 。 


8.1.2 2% Jak] > 


快速 排序 有 两 个 最 基本 的 步骤 : 将 数据 划分 到 中 枢 元 素 之 前 或 之 后 ， 然 后 对 中 枢 元 素 之 前 和 
之 后 的 两 半数 组 再 次 进行 快速 排序 。 这 里 不 能 通过 对 数据 的 简单 划分 达到 并 行 ， 因 为 ， 只 有 
在 一 次 排序 结束 后 ， 才 能 知道 哪些 项 在 中 枢 元素 之 前 和 之 后 。 当 要 对 这 种 算法 进行 并 行 化 ， 
很 自然 的 会 想到 使 用 递归 。 每 一 级 的 递归 都 会 多 次 调用 quick_sort 函 数 ， 因 为 需要 知道 哪些 元 
素 在 中 枢 元 素 之 前 和 之 后 。 递 归 调 用 是 完全 独立 的 ， 因 为 其 访问 的 是 不 同 的 数据 集 ， 并且 每 
次 迭代 都 能 并 发 执行 。 图 8.2 展 示 了 这 样 的 递归 划分 。 
































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































图 8.2 递归 划分 数据 


在 第 4 章 中 ， 已 经 见 过 这 种 实现 。 比 起 对 大 于 和 小 于 的 数据 块 递归 调用 函数 ， 使 
用 std::async() 可 以 为 每 一 级 生成 小 于 数据 块 的 异步 任务 。 使 用 std::async() 时 ， c++ 线程 
库 就 能 决定 何 时 让 一 个 新 线程 执行 任务 ， 以 及 同步 执行 任务 。 


重要 的 是 : 对 一 个 很 大 的 数据 集 进 行 排序 时 ， 当 每 层 递归 都 产生 一 个 新 线程 ， 最 后 就 会 产生 
大 量 的 线程 。 你 会 看 到 其 对 性 能 的 影响 ， 如 果 有 太 多 的 线程 存在 ， 那 么 你 的 应 用 将 会 运行 的 
很 慢 。 如 果 数 据 集 过 于 庞大 ， 会 将 线程 耗 尽 。 那 么 在 递归 的 基础 上 进行 任务 的 划分 ， 就 是 一 
个 不 错 的 主意 ; 你 只 需要 将 一 定数 量 的 数据 打包 后 ， 交 给 线程 即 可 。 std: :async() 可 以 出 里 
这 种 简单 的 情况 ， 不 过 这 不 是 唯一 的 选择 。 

另 一 种 选择 是 使 用 std::thread::hardware_concurrency() 函数 来 确定 线程 的 数量 ， 就 像 在 清单 
2.8 中 的 并 行 版 accumulate() 一 样 。 然 后 ， 你 可 以 将 已 排序 的 数据 推 到 线程 安全 的 栈 上 (如 第 
6、7 章 中 提 及 的 栈 )。 当 线程 无 所 事 事 ， 不 是 已 经 完成 对 自己 数据 块 的 梳理 ， 就 是 在 等 待 一 组 
排序 数据 的 产生 ; 线程 可 以 从 栈 上 获取 这 组 数据 ， 并 且 对 其 排序 。 

下 面 的 代码 就 是 使 用 以 上 方式 进行 的 实现 。 


清单 8.1 使 用 栈 的 并 行 快 速 排序 前 法 一 一 等 待 数据 块 排序 





template<typename T> 
struct sorter // 1 
{ 
struct chunk_to_sort 
{ 
std::list<T> data; 
std: :promise<std::list<T> > promise; 


ee 


thread_safe_stack<chunk_to_sort> chunks; // 2 
std::vector<std::thread> threads; // 3 
unsigned const max_thread_count; 
std::atomic<bool> end_of_data; 


sorter(): 
max_thread_count(std::thread: :hardware_concurrency()-1), 
end_of_data(false) 


{} 


~sorter() // 4 


{ 
end_of_data=true; // 5 


for(unsigned i=0;i<threads.size();++i) 


{ 
threads[i].join(); // 6 


void try_sort_chunk() 
{ 
boost::shared_ptr<chunk_to_sort > chunk=chunks.pop(); // 7 
if (chunk ) 
{ 
sort_chunk(chunk); // 8 


std::list<T> do_sort(std::list<T>& chunk_data) // 9 
{ 
if(chunk_data.empty() ) 


{ 


return chunk_data; 


std::list<T> result; 
result.splice(result.begin(),chunk_data, chunk_data.begin()); 
T const& partition_val=*result.begin(); 


typename std::list<T>::iterator divide point= // 10 
std: :partition(chunk_data.begin(),chunk_data.end(), 
[&](T const& val){return val<partition_val;}); 


chunk_to_sort new_lower_chunk; 
new_lower_chunk.data.splice(new_lower_chunk.data.end(), 
chunk_data, chunk_data.begin(), 
divide point); 


std: :future<std::list<T> > new_lower= 
new_lower_chunk.promise.get_future(); 

chunks.push(std: :move(new_lower_chunk)); // 11 

if(threads.size()<max_thread_count) // 12 


{ 


threads.push_back(std::thread(&sorter<T>::sort_thread, this) ); 
} 


std::list<T> new_higher(do_sort(chunk_data) ); 


result.splice(result.end(),new_higher ); 
while(new_lower.wait_for(std::chrono::seconds(0)) != 
std::future_status::ready) // 13 


try_sort_chunk(); // 14 


result.splice(result.begin(),new_lower.get()); 
return result; 


void sort_chunk(boost::shared_ptr<chunk_to_sort> const& chunk) 


{ 


chunk->promise.set_value(do_sort(chunk->data)); // 15 


void sort_thread() 


{ 
while(!end_of_data) // 16 


{ 


try_sort_chunk(); // 17 
std::this_thread::yield(); // 18 


} 
7 


template<typename T> 
std::list<T> parallel_quick_sort(std::list<T> input) // 19 
{ 

if(input.empty()) 

{ 


return input; 


} 


sorter<T> sS; 


return s.do_sort(input); // 20 


R £ > parallel _quick_sot AXIA T sorterAOU Ase > A HARE BG RA BE 
块 @， 并 且 对 线程 进行 设置 国 。do_sort 成 员 函 数 回 主要 做 的 就 是 对 数据 进行 划分 四 。 相 较 于 对 
每 一 个 数据 块 产生 一 个 新 的 线程 ， 这 次 会 将 这 些 数据 块 推 到 栈 上 (DD ; 并 在 有 备用 处 理 器 (2 的 
产生 新 线程 。 因 为 小 于 部 分 的 数据 块 可 能 由 其 他 线程 进行 处 理 ， 那 么 就 得 等 待 这 个 线 

完成 。 为 了 让 所 有 事情 顺利 进行 (只 有 一 个 线程 和 其 他 所 有 线程 都 忙碌 时 )， 当 线程 处 于 等 
ate yw kl TOI RT 是 从 栈 上 弹出 一 个 数据 块 
@， 并 且 对 其 进行 排序 回 ， 将 结果 存在 promise 中 ， 让 线程 对 已 经 存在 于 栈 上 的 数据 块 进 行 提 
HID © 


Send of data 没 有 被 设置 时 加 ， 新 生成 的 线程 还 在 尝试 从 栈 上 获取 需要 排序 的 数据 块 加。 在 
循环 检查 中 ， 也 要 给 其 他 线程 机 会 18， 可 以 从 栈 上 取 下 数据 块 进行 更 多 的 操作 。 这 里 的 实现 
依赖 于 sorter 类 四 对 线程 的 清理 。 当 所 有 数据 都 已 经 排序 完成 ，do_sort 将 会 返回 (即使 还 有 工 
作 线 程 在 运行 )， 所 以 主线 程 将 会 从 parallel_quick_sort20 中 返 Se ee sorter xt 
Ro MA BRA Bend of datatkK SO? LRSMAHARBARLUO o HAH EEG AIL 
线程 函数 内 部 的 循环 (6) 。 


在 这 个 方案 中 ， 不 用 为 spawn_task 产 生 的 无 数 线程 所 困扰 ， 并 且 也 不 用 再 依赖 c++ 线程 库 ， 
为 你 选择 执行 线程 的 数量 (就 像 std: :async() MEAE) 。 该 方案 制约 线程 数量 的 值 就 

是 std::thread: :hardware_concurrency() 的 值 ， 这 样 就 和 能 避免 任务 过 于 频繁 的 切换 。 不 过 ， 这 
里 还 有 两 个 问题 : 线程 管理 和 线程 通讯 。 要 解决 这 两 个 问题 就 要 增加 代码 的 复杂 程度 。 虽 
然 ， 线 程 对 数据 项 是 分 开 处 理 的 ， 不 过 所 有 对 栈 的 访问 ， 都 可 以 向 栈 添加 新 的 数据 块 ， 并 且 
移出 数据 块 以 作 处 理 。 这 里 重度 的 竞争 会 降低 性 能 (即使 使 用 无 锁 (无 阻塞 ) 栈 )， 原 因 将 会 在 后 
面 提 到 。 


这 个 方案 使 用 到 了 一 个 特殊 的 线程 池 _ 所 有 线程 的 任务 都 来 源 于 一 个 等 待 链表 ， 然 后 线程 
会 去 完成 任务 ， 完 成 任务 后 会 再 来 链表 提取 任务 。 这 个 线程 池 很 有 问题 (包括 对 工作 链表 的 竞 
争 )， 这 个 问题 的 解决 方案 将 在 第 9 章 提 到 。 关 于 多 处 理 器 的 问题 ， 将 会 在 本 章 后 面 的 章节 中 做 
出 更 为 详细 的 介绍 ( 详 见 8.2.1)。 





几 种 划分 方法 : 1， 处 理 前 划分 ; 2， 递 归 划 分 (都 需要 事先 知道 数据 的 长 度 国定 )， 还 有 上 面 的 
那 种 划分 方式 。 事 情 并 非 总 是 这 样 好 解决 ; 当 数据 是 动态 生成 ， 或 是 通过 外 部 输入 ， 那 么 这 
里 的 办 法 就 不 适用 了 。 在 这 种 情况 下 ， 基 于 任务 类 型 的 划分 方式 ， 就 要 好 于 基于 数据 的 划分 
方式 。 


8.1.3 通过 任务 类 型 划分 工作 


虽然 为 每 个 线程 分 配 不 同 的 数据 块 ， 但 工作 的 划分 (无 论 是 之 前 就 划分 好 ， 还 是 使 用 递归 的 方 
式 划 分 ) 仍 然 在 理论 阶段 ， 因 为 这 里 每 个 线程 对 每 个 数据 块 的 操作 是 相同 的 。 而 另 一 种 选择 是 
让 线程 做 专门 的 工作 ， 也 就 是 每 个 线程 做 不 同 的 工作 ， 就 像 水 管 工 和 电工 在 建造 一 所 屋子 的 

时 候 所 做 的 不 同 工 作 那样 。 线 程 可 能 会 对 同一 段 数据 进行 操作 ， 但 它们 对 数据 进行 不 同 的 操 

作 。 


对 分 工 的 排序 ， 也 就 是 从 并 发 分 离 关 注 结 果 ; 每 个 线程 都 有 不 同 的 任务 ， 这 就 意味 着 扶 正 意 
义 上 的 线程 独立 。 其 他 线程 偶尔 会 向 特定 线程 交付 数据 ， 或 是 通过 触发 事件 的 方式 来 进行 处 
理 ; 不 过 总 体 而 言 ， 每 个 线程 只 需要 关注 自己 所 要 做 的 事情 即 可 。 其 本 身 就 是 基本 良好 的 设 
计 ， 每 一 段 代 码 只 对 自己 的 部 分 负责 。 


分 离 关 注 


当 有 多 个 任务 需要 持续 运行 一 段 时 间 ， 或 需要 及 时 进行 处 理 的 事件 (比如 ， 按 键 事 件 或 传 入 网 
络 数据 )， 且 还 有 其 他 任务 正在 运行 时 ， 单 线程 应 用 采用 的 是 单 职责 原则 处 理 冲突 。 单 线程 的 
世界 中 ， 代 码 会 执行 任务 A( 部 分 ) 后 ， 再 去 执行 任务 B( 部 分 )， 再 检查 按钮 事件 ， 再 检查 传 入 的 
网 络 包 ， 然 后 在 循环 回去 ， 执 行 任务 A。 这 将 会 使 得 任务 A 复杂 化 ， 因 为 需要 存储 完成 状态 ， 
以 及 定期 从 主 循 环 中 返回 。 如 果 在 循环 中 添加 了 很 多 任务 ， 那 么 程序 将 运行 的 很 慢 ; 并 且 用 
户 会 发 现 ， 在 他 /她 按 下 按键 后 ， 很 久之 后 才 会 有 反应 。 我 确定 你 已 经 在 一 些 程序 中 见 过 这 种 
情况 : 你 给 程序 分 配 一 项 任务 后 ， 发 现 接口 会 封锁 ， 直 到 这 项 任务 完成 。 


当 使 用 独立 线程 执行 任务 时 ， 操 作 系 统 会 帮 你 处 理 接口 问题 。 在 执行 任务 A 时 ， 线 程 可 以 专注 
于 执行 任务 ， 而 不 用 为 保存 状态 从 主 循环 中 返回 。 操 作 系统 会 自动 保存 状态 ， 当 需要 的 时 

候 ， 将 线程 切换 到 任务 B 或 任务 C。 如 果 目 标 系统 是 带 有 多 核 或 多 个 处 理 器 ， 任 务 A 和 任务 B 可 
很 可 能 丨 正 的 并 发 执行 。 这 样 处 理 按键 时 间或 网 络 包 的 代码 ， 就 能 及 时 执行 了 。 所 有 事情 都 
完成 的 很 好 ， 用 户 得 到 了 及 时 的 响应 ; 当然 ， 作 为 开发 者 只 需要 写 有 具体 操作 的 代码 即 可 ， 不 
用 再 将 控制 分 支 和 使 用 用 户 交 互 混 在 一 起 了 。 


听 起 来 不 错 ， 玫 瑰 色 的 愿景 呀 。 事 实 站 像 上 面 所 说 的 那样 简单 ? 一 切取 决 于 细节 。 如 果 每 件 
事 都 是 独立 的 ， 那 么 线程 间 就 不 需要 交互 ， 这 样 的 话 一 切 都 很 简单 了 。 不 幸 的 是 ， 现 实 没 那 
么 美好 。 后 台 那 些 优雅 的 任务 ， 经 常会 被 用 户 要 求 做 一 些 事情 ， 并 且 它 们 需要 通过 更 新 用 户 
接口 的 方式 ， 来 让 用 户 知 道 它 们 完成 了 任务 。 或 者 ， 用 户 可 能 想 要 取消 任务 ， 这 就 需要 用 户 
向 接口 发 送 一 条 消息 ， 告 知 后 台 任 务 停止 运行 。 这 两 种 情况 都 需要 认 昌 考虑 ， 设 计 ， 以 及 适 
当 的 同步 ， 不 过 这 里 担心 的 部 分 还 是 分 离 的 。 用 户 接口 线程 只 能 处 理 用 户 接口 ， 当 其 他 线程 
告诉 该 线程 要 做 什么 时 ， 用 户 接口 线程 会 进行 更 新 。 同 样 ， 后 台 线 程 只 运行 它们 所 关注 的 任 
务 ; 只 是 ， 有 时 会 发 生 “ 允 许 任 务 被 其 他 线程 所 停止 "的 情况 。 在 这 两 种 情况 下 ， 后 台 线 程 需 要 
照顾 来 自 其 他 线程 的 请 求 ， 线 程 本 身 只 知道 它们 请 求 与 自己 的 任务 有 所 关联 。 


多 线程 下 有 两 个 危险 需要 分 离 关注 。 第 一 个 是 对 错误 担忧 的 分 离 ， 主 要 表现 为 线程 间 共 享 着 
很 多 的 数据 ， 或 者 不 同 的 线程 要 相互 等 待 ; 这 两 种 情况 都 是 因为 线程 间 很 密切 的 交互 。 当 这 
种 情况 发 生 ， 就 需要 看 一 下 为 什么 需要 这 么 多 交互 。 当 所 有 交互 都 有 关于 同样 的 问题 ， 就 应 
该 使 用 单线 程 来 解决 ， 并 将 引用 同一 原因 的 线程 提取 出 来 。 或 者 ， 当 有 两 个 线程 需要 频繁 的 
交流 ， 且 没有 其 他 线程 时 ， 那 么 就 可 以 将 这 两 个 线程 合 为 一 个 线程 。 


当 通 过 任务 类 型 对 线程 间 的 任务 进行 划分 时 ， 不 应 该 让 线程 处 于 完全 隔离 的 状态 。 当 多 个 输 
入 数据 集 需要 使 用 同样 的 操作 序列 ， 可 以 将 序列 中 的 操作 分 成 多 个 阶段 ， 来 让 每 个 线程 执 
行 。 

划分 任务 序列 


当 任 务 会 应 用 到 相同 操作 序列 ， 去 处 理 独立 的 数据 项 时 ， 就 可 以 使 用 流水 线 (pipeline) 系 统 进 
行 并 发 。 这 好 上 比 一 个 物理 管道 : 数据 流 从 管道 一 端 进入 ， 在 进行 一 系列 操作 后 ， 从 管道 另 一 
端 出 去 。 


使 用 这 种 方式 划分 工作 ， 可 以 为 流水 线 中 的 每 一 阶段 操作 创建 一 个 独立 线程 。 当 一 个 操作 完 
成 ， 数 据 元 素 会 放 在 队列 中 ， 以 供 下 一 阶段 的 线程 提取 使 用 。 这 就 允许 第 一 个 线程 在 完成 对 
于 第 一 个 数据 块 的 操作 ， 并 要 对 第 二 个 数据 块 进行 操作 时 ， 第 二 个 线程 可 以 对 第 一 个 数据 块 
执行 管线 中 的 第 二 个 操作 。 


这 就 是 在 线程 间 划 分 数据 的 一 种 替代 方案 (如 8.1.1 描 述 ) ; 这 种 方式 适合 于 操作 开始 前 ， 且 对 输 
入 数据 处 长 度 不 清楚 的 情况 。 例 如 ， 数 据 来 源 可 能 是 从 网 络 ， 或 者 可 能 是 通过 扫描 文件 系统 
来 确定 要 处 理 的 文件 。 


流水 线 对 于 队列 中 耗 时 的 操作 处 理 的 也 很 合理 ; 通过 对 线程 间 任 务 的 划分 ， 就 能 对 应 用 的 性 

能 所 有 改善 。 假 设 有 20 个 数据 项 ， 需 要 在 四 核 的 机 器 上 处 理 ， 并 且 每 一 个 数据 项 需要 四 个 步 
骤 来 完成 操作 ， 每 一 步 都 需要 3 秒 来 完成 。 如 果 你 将 数据 分 给 了 四 个 线程 ， 那 么 每 个 线程 上 就 
有 5 个 数据 项 要 处 理 。 假 设 在 处 理 的 时 候 ， 没 有 其 他 线程 对 处 理 过 程 进行 影响 ， 在 12 秒 后 4 个 
数据 项 处 理 完成 ，24 秒 后 8 个 数据 项 处 理 完成 ， 以 此 类 推 。 当 20 个 数据 项 都 完成 操作 ， 就 需要 
1 分 钟 的 时 间 。 在 管线 中 就 会 完全 不 同 。 四 步 可 以 交 给 四 个 内 核 。 那 么 现在 ， 第 一 个 数据 项 可 
以 被 每 一 个 核 进 行 处 理 ， 所 以 其 还 是 会 消耗 12 秒 。 的 确 ， 在 12 秒 后 你 就 能 得 到 一 个 处 理 过 的 
数据 项 ， 这 相 较 于 数据 划分 并 没有 好 多 少 。 不 过 ， 当 流水 线 流动 起 来 ， 事 情 就 会 不 一 样 了 ; 


在 第 一 个 核 处 理 第 一 个 数据 项 后 ， 数 据 项 就 会 交 给 下 一 个 内 核 ， 所 以 第 一 个 核 在 处 理 完 第 一 
个 数据 项 后 ， 其 还 可 以 对 第 二 个 数据 项 进行 处 理 。 那 么 在 12 秒 后 ， 每 3 秒 将 会 得 到 一 个 已 处 理 
的 数据 项 ， 这 就 要 好 于 每 隔 12 秒 完成 4 个 数据 项 。 


为 什么 整 批 处 理 的 时 间 要 长 于 流水 线 呢 ? 因为 你 需要 在 最 终 核 开始 处 理 第 一 个 元 素 前 等 待 9 
秒 。 更 平滑 的 操作 ， 能 在 某 些 情况 下 获 益 更 多 。 o 考虑 如 下 情况 : 当 一 个 系统 用 来 播放 高 清 数 
字 视 频 。 为 了 让 视频 能 够 播放 ， 你 至 少 要 保证 25 帧 每 秒 的 解码 速度 。 同 样 的 ， 这 些 图 像 需要 
有 均匀 的 间隔 ， 才 会 给 观众 留 有 连续 播放 的 感觉 ; 一 个 应 用 可 以 在 1 秒 解 码 100 帧 ， 不 过 在 解 
完 就 需要 暂停 1s 的 时 候 ， 这 个 应 用 就 没有 意义 了 。 另 一 方面 ， 观 众 能 接受 在 视频 开始 播放 的 
时 候 有 一 定 的 延迟 。 这 种 情况 ， 并 行使 用 流水 线 就 能 得 到 稳定 的 解码 率 。 


看 了 这 么 多 线程 间 划 分 工作 的 技术 ， 接 下 来 让 我 们 来 看 一 下 在 多 线程 系统 中 有 哪些 因素 会 影 
响 性 能 ， 并 且 这 些 因素 是 如 何 影 响 你 选择 划分 方案 的 。 


[1] http:/Awww.mpi-forum.org/ 


[2] http:/Awww.openmp.org/ 


影响 并 发 代码 性 能 的 因素 


“多 处 理 系统 中 ， 使 用 并 发 的 方式 来 提高 代码 的 效率 时 ， 你 需要 了 解 一 下 有 哪些 因素 会 影响 并 
发 的 效率 。 即 使 已 经 使 用 多 线程 对 关注 进行 分 离 ， 还 需要 确定 是 否 会 对 性 能 造成 负面 影响 。 
因为 ， 在 16 核 机 器 上 应 用 的 速度 与 单 核 机 器 相当 时 ， 用 户 是 不 会 打 死 你 的 。 





之 后 你 会 看 到 ， 在 多 线程 代码 中 有 很 多 因素 会 影响 性 能 对 线程 处 理 的 数据 做 一 些 简单 的 
改动 (其 他 不 变 )， 都 可 能 对 性 能 产生 戏剧 性 的 效果 。 所 以 ， 多 言 无 益 ， 让 我 们 来 看 一 下 这 些 因 
素 吧 ， 从 明显 的 开始 : 目标 系统 有 多 少 个 处 理 器 ? 


8.2.1 有 多 少 个 处 理 器 


处 理 器 个 数 是 影响 多 线程 应 用 的 首要 因素 。 在 茶 些 情况 下 ， 你 对 目标 硬件 会 很 熟悉 ， 并 且 针 
对 硬件 进行 设计 ， 并 在 目标 系统 或 副本 上 进行 测量 。 如 果 是 这 样 ， 那 你 很 幸运 ; 不 过 ， 要 知 
道 这 些 都 是 很 奢侈 的 。 你 可 能 在 一 个 类 似 的 平台 上 进行 开发 ， 不 过 你 所 使 用 的 平台 与 目标 平 
台 的 差异 很 大 。 例 如 ， 你 可 能 会 在 一 个 双 芯 或 四 芯 的 系统 上 做 开发 ， 不 过 你 的 用 户 系 统 可 能 
就 只 有 一 个 处 理 器 (可 能 有 很 多 芯 )， 或 多 个 单 芯 处 理 器 ， 亦 或 是 多 核 多 芯 的 处 理 器 。 在 不 同 的 
平台 上 ， 并 发 程序 的 行为 和 性 能 特点 就 可 能 完全 不 同 ， 所 以 你 需要 仔细 考虑 那些 地 方 会 被 影 
响 到 ， 如 果 会 被 影响 ， 就 需要 在 不 同 平台 上 进行 测试 。 


一 个 单 核 16 芯 的 处 理 器 和 四 核 双 芯 或 十 六 核 单 芯 的 处 理 器 相同 : 在 任何 系统 上 ， 都 能 运行 16 
个 并 发 线程 。 当 线程 数量 少 于 16 个 时 ， 会 有 处 理 器 处 于 空闲 状态 (除非 系统 同时 需要 运行 其 他 
应 用 ， 不 过 我 们 暂时 忽略 这 种 可 能 性 )。 另 一 方面 ， 当 多 于 16 个 线程 在 运行 的 时 候 (都 没有 阻塞 
或 等 待 )， 应 用 将 会 浪费 处 理 器 的 运算 时 间 在 线程 间 进 行 切 换 ， 如 第 1 章 所 述 。 这 种 情况 发 生 

时 ， 我 们 称 其 为 超额 认购 (oversubscription)。 


为 了 扩展 应 用 线程 的 数量 ， 与 硬件 所 支持 的 并 发 线程 数量 一 致 ， cr+ 标准 线程 库 提供 
了 std::thread: :hardware_concurrency() ° 使 用 这 个 函数 就 能 知道 在 给 定 硬件 上 可 以 扩展 的 线 
程 数量 了 。 


需要 谨 懂 使 用 std::thread::hardware_concurrency() ? 因为 代码 不 会 考虑 有 其 他 运 去 行 在 系统 上 
的 线程 (除非 已 经 将 系统 信息 进行 共享 )。 最 坏 的 情况 就 是 ， 多 线程 同时 调 

用 std::thread: :hardware _concurrency() 函数 来 对 线程 数量 进行 扩展 ? Sy ai 
认购 。 std: :async() 就 能 避免 这 个 问题 ， 因为 标准 库 会 对 所 有 的 调用 进行 适当 的 安排 。 同 
样 ， 谨 懂 的 使 用 线程 池 也 可 以 避免 这 个 问题 。 


不 过 ， 即 使 你 已 经 考虑 到 所 有 在 应 用 中 运行 的 线程 ， 程 序 还 要 被 同时 运行 的 其 他 程序 所 影 

响 。 虽 然 ， 在 单 用 户 系统 中 ， 使 用 多 个 CPU 密集 型 应 用 程序 很 军 见 ， 但 在 菜 些 领域 ， 这 种 情 
况 就 很 常见 了 。 虽 然 系 统 能 提供 选择 线程 数量 的 机 制 ， 但 这 种 机 制 已 经 超出 c++ 标准 的 范 
围 。 这 里 的 一 种 选择 是 使 用 与 std::async() 类 似 的 工具 ， 来 为 所 有 执行 异步 任务 的 线程 的 数 


量 做 考虑 ; 另 一 种 选择 就 是 ， 限 制 每 个 应 用 使 用 的 处 理 芯 个 数 。 我 倒是 希望 ， 这 种 限制 能 
映 到 std::thread::hardware_concurrency() 上 面 (不 能 保证 )。 如 果 你 需要 处 理 这 种 情况 ， 可 以 
看 一 下 你 所 使 用 的 系统 说 明 ， 了 解 一 下 是 否 有 相关 选项 可 供 使 用 。 


理想 算法 可 能 会 取决 于 问题 规模 与 处 理 单元 的 比值 。 大 规模 并 行 系统 中 有 很 多 的 处 理 单元 ， 
算法 可 能 就 会 同时 执行 很 多 操作 ， 让 应 用 更 快 的 结束 ; 这 就 要 快 于 执行 较 少 操作 的 平台 ， 
为 该 平台 上 的 每 一 个 处 理 器 只 能 执行 很 少 的 操作 。 


随 着 处 理 器 数量 的 增加 ， 另 一 个 问题 就 会 来 影响 性 能 : 多 个 处 理 器 尝试 访问 同一 个 数据 。 


8.2.2 数据 争 用 与 乒乓 缓存 


当 两 个 线程 并 发 的 在 不 同 处 理 器 上 执行 ， 并 且 对 同一 数据 进行 读 取 ， 通 常 不 会 出 现 问 题 ; 
为 数据 将 会 拷贝 到 每 个 线程 的 缓存 中 ， 并 且 可 以 让 两 个 处 理 器 同时 进行 处 理 。 不 过 ， 当 有 线 
程 对 数据 进行 修改 的 时 候 ， 这 个 修改 需要 更 新 到 其 他 核 芯 的 缓存 中 去 ， 就 要 耗费 一 定 的 时 
闻 。 根 据 线程 的 操作 性 质 ， 以 及 使 用 到 的 内 存 序 ， 这 样 的 修改 可 能 会 让 第 二 个 处 理 器 停 下 
来 ， 等 待 硬件 内 存 更 新 缓存 中 的 数据 。 即 便 是 精确 的 时 间 取 决 于 硬件 的 物理 结构 ， 不 过 根据 
CPU 指令 ， 这 是 一 个 特别 特别 慢 的 操作 ， 相 当 于 执行 成 百 上 二 个 独立 指令 。 


思考 下 面 简短 的 代码 段 : 


std::atomic<unsigned long> counter(0); 
void processing_loop() 
{ 
while(counter.fetch_add(1, std: :memory_order_relaxed) 
<100000000 ) 
{ 


do_something(); 


counter 变 量 是 全 局 的 ， 所 以 任何 线程 都 能 调用 processing_loop() 去 修改 同一 个 变量 。 因 此 ， 
当 新 增加 的 处 理 器 时 ，counter 变 量 必须 要 在 缓存 内 做 一 份 描 贝 ， 再 改变 自己 的 值 ， 或 其 他 线 
程 以 发 布 的 方式 对 缓存 中 的 拷贝 副本 进行 更 新 。 即 使 用 sta::memory_order_relaxed ， 编 译 器 
不 会 为 任何 数据 做 同步 操作 ，fetch_add 是 一 个 “ 读 - 改 - 写 " 操 作 ， 因 此 就 要 对 最 新 的 值 进行 检 
索 。 如 果 另 一 个 线程 在 另 一 个 处 理 器 上 执行 同样 的 代码 ，counter 的 数据 需要 在 两 个 处 理 器 之 
间 进 行 传递 ， 那 么 这 两 个 处 理 器 的 缓存 中 间 就 存 有 counter 的 最 新 值 ( 当 counter 的 值 增加 时 )。 
如 果 do_something() 足 够 短 ， 或 有 很 多 处 理 器 来 对 这 段 代码 进行 处 理 时 ， 处 理 器 将 会 互相 等 
待 ; 一 个 处 理 器 准备 更 新 这 个 值 ， 另 一 个 处 理 器 正在 修改 这 个 值 ， 所 以 该 处 理 器 就 不 得 不 等 


待 第 二 个 处 理 器 更 新 完成 ， 并 且 完 成 更 新 传递 时 ， 才 能 执行 更 新 。 这 种 情况 被 称 为 高 竞争 
(high contention)。 如 果 处 理 器 很 少 需要 互相 等 待 ， 那 么 这 种 情况 就 是 低 竞 争 (low 
contention) ° 


在 这 个 循环 中 ，counter 的 数据 将 在 每 个 缓存 中 传递 若干 次 。 这 就 叫做 乒 兵 缓存 (cache ping- 
pong)， 这 种 情况 会 对 应 用 的 性 能 有 着 重大 的 影响 。 当 一 个 处 理 器 因为 等 待 缓存 转移 而 停止 运 
行 时 ， 这 个 处 理 器 就 不 能 做 任何 事情 ， 所 以 对 于 整个 应 用 来 说 ， 这 就 是 一 个 坏 消息 。 


你 可 能 会 想 ， 这 种 情况 不 会 发 生 在 你 身上 ; 因为 ， 你 没有 使 用 任何 循环 。 你 确定 吗 ? 那么 互 
FAR? 如 果 你 需要 在 循环 中 放置 一 个 互 斥 量 ， 那 么 你 的 代码 就 和 之 前 从 数据 访问 的 差不多 
了 。 为 了 锁 住 互 斥 量 ， 另 一 个 线程 必须 将 数据 进行 转移 ， 就 能 弥补 处 理 器 的 互 斥 性 ， 并 且 对 
数据 进行 修改 。 当 这 个 过 程 完成 时 ， 将 会 再 次 对 互 斥 量 进行 修改 ， 并 对 线程 进行 解锁 ， 之 后 
互 斥 数 据 将 会 传递 到 下 一 个 需要 互 斥 量 的 线程 上 去 。 和 转移 时 间 ， 就 是 第 二 个 线程 等 待 第 一 个 
线程 释放 互 斥 量 的 时 间 : 


std::mutex m; 
my_data data; 
void processing _loop_with_mutex() 





{ 
while(true) 
{ 
std::lock_guard<std::mutex> 1k(m); 
if(done_processing(data)) break; 
} 
} 


接 下 来 看 看 最 糟糕 的 部 分 : 数据 和 互 斥 量 已 经 准备 好 让 多 个 线程 进 访 问 之 后 ， 当 系统 中 的 核 
心 数 和 处 理 器 数量 增加 时 ， 很 可 能 看 到 高 竞争 ， 以 及 一 个 处 理 器 等 待 其 他 处 理 器 的 情况 。 如 
果 在 多 线程 情况 下 ， 能 更 快 的 对 同样 级 别 的 数据 进行 处 理 ， 线 程 就 会 对 数据 和 互 斥 量 进行 竞 
争 。 这 里 有 很 多 这 样 的 情况 ， 很 多 线程 会 同时 尝试 对 互 不 量 进 行 获取 ， 或 者 同时 访问 变量 ， 


A 


等 等 。 


互 斥 量 的 竞争 通常 不 同 于 原子 操作 的 竞争 ， 最 简单 的 原因 是 ， 互 斥 量 通 常 使 用 操作 系统 级 别 
的 序列 化 线程 ， 而 非 处 理 器 级 别 的 。 如 果 有 足够 的 线程 去 执行 任务 ， 当 有 线程 在 等 待 互 斥 量 
时 ， 操 作 系 统 会 安排 其 他 线程 来 执行 任务 ， 而 处 理 器 只 会 在 其 他 线程 运行 在 目标 处 理 器 上 

时 ， 让 该 处 理 器 停止 工作 。 不 过 ， 对 互 不 量 的 竞争 ， 将 会 影响 这 些 线程 的 性 能 ; 毕竟 ， 只 能 
让 一 个 线程 在 同一 时 间 运 行 。 

回顾 第 3 章 ， 一 个 很 少 更 新 的 数据 结构 可 以 被 一 个 " 单 作 者 ， 多 读者 互 矿 量 ( 详 见 3.3.2)。 乒 兵 


缓存 效应 可 以 抵消 互 斥 所 带 来 的 收益 (工作 量 不 利 时 )， 因 为 所 有 线程 访问 数据 (即使 是 读者 线 
程 ) 都 会 对 互 斥 量 进行 修改 。 随 着 处 理 器 对 数据 的 访问 次 数 增加 ， 对 于 互 斥 量 的 竞争 就 会 增 


加 ， 并 且 持 有 互 斥 量 的 缓存 行将 会 在 核 芯 中 进行 转移 ， 因 此 会 增加 不 良 的 锁 获 取 和 释放 次 
数 。 有 一 些 方 法 可 以 改善 这 个 问题 ， 其 本 质 就 是 让 互 斥 量 对 多 行 缓存 进行 保护 ， 不 过 这 样 的 
互 矿 量 需要 自己 去 实现 。 


如 果 乒 兵 缓 存 是 一 个 糟糕 的 现象 ， 那 么 该 怎么 避免 它 呢 ? 在 本 章 后 面 ， 答 案 会 与 提高 并 发 潜 
能 的 指导 意见 相 结 合 : 减少 两 个 线程 对 同一 个 内 存 位 置 的 竞争 。 


虽然 ， 要 实现 起 来 并 不 简单 。 即 使 给 定 内 存 位 置 被 一 个 线程 所 访问 ， 可 能 还 是 会 有 乒 兵 缓存 
的 存在 ,是 因为 另 一 种 叫做 伪 共 享 (false sharing) 的 效应 。 


8.2.3 伪 共 享 


处 理 器 缓存 通常 不 会 用 来 处 理 在 单个 存储 位 置 ， 但 其 会 用 来 处 理 称 为 缓存 行 (cache lines) 的 内 
存 块 。 内 存 块 通常 大 小 为 32 或 64 字 节 ， 实 际 大 小 需要 由 正在 使 用 着 的 处 理 器 模型 来 决定 。 因 
为 硬件 缓存 进 处 理 缓存 行 大 小 的 内 存 块 ， 较 小 的 数据 项 就 在 同一 内 存 行 的 相 邻 内 存 位 置 上 。 

有 时 ， 这 样 的 设 定 还 是 挺 不 错 : 当 线 程 访问 的 一 组 数据 是 在 同一 数据 行 中 ， 对 于 应 用 的 性 能 
来 说 就 要 好 于 向 多 个 缓存 行进 行 传播 。 不 过 ， 当 在 同一 缓存 行 存储 的 是 无 关 数 据 ， 且 需要 被 
不 同 线程 访问 ， 这 就 会 造成 性 能 问题 。 


假设 你 有 一 个 int 类 型 的 数组 ， 并 且 有 一 组 线程 可 以 访问 数组 中 的 元 素 ， 且 对 数组 的 访问 很 频 
繁 (包括 更 新 )。 通 常 int 类 型 的 大 小 要 小 于 一 个 缓存 行 ， 同 一 个 缓存 行 中 可 以 存储 多 个 数据 项 。 
因此 ， 即 使 每 个 线程 都 能 对 数据 中 的 成 员 进 行 访问 ， 硬 件 缓存 还 是 会 产生 乒乓 缓存 。 每 当 线 
程 访 问 0 号 数据 项 ， 并 对 其 值 进行 更 新 时 ， 绥 存 行 的 所 有 权 就 需要 转移 给 执行 该 线程 的 处 理 
器 ， 这 仅 是 为 了 让 更 新 1 号 数据 项 的 线程 获取 1 号 线程 的 所 有 权 。 缓 存 行 是 共享 的 (即使 没有 数 
据 存 在 )， 因 此 使 用 伪 共 享 来 称呼 这 种 方式 。 这 个 问题 的 解决 办 法 就 是 对 数据 进行 构造 ， 让 同 
一 线程 访问 的 数据 项 存在 临近 的 内 存 中 (就 像 是 放 在 同一 缓存 行 中 )， 这 样 那些 能 被 独立 线程 访 
问 的 数据 将 分 布 在 相距 很 远 的 地 方 ， 并 且 可 能 是 存储 在 不 同 的 缓存 行 中 。 在 本 章 接 下 来 的 内 
容 中 看 到 ， 这 种 思路 对 代码 和 数据 设计 的 影响 。 


如 果 多 线程 访问 同一 内 存 行 是 一 种 糟糕 的 情况 ， 那 么 在 单线 程 下 的 内 存 布局 将 会 如 何 带 来 哪 
些 影响 呢 ? 


8.2.4 如 何 让 数据 紧凑 ? 


伪 共 享 发 生 的 原因 : 某 个 线程 所 要 访问 的 数据 过 于 接近 另 一 线程 的 数据 ， 另 一 个 是 与 数据 布 
局 相关 的 陷阱 会 直接 影响 单线 程 的 性 能 。 问 题 在 于 数据 过 于 接近 : 当 数 据 能 被 单线 程 访 问 
时 ， 那 么 数据 就 已 经 在 内 存 中 展开 ， 就 像 是 分 布 在 不 同 的 缓存 行 上 。 另 一 方面 ， 当 内 存 中 有 
能 被 单线 程 访问 紧凑 的 数据 时 ， 就 如 同 数据 分 布 在 同一 缓存 行 上 。 因 此 ， 当 数据 已 传播 ， 那 
么 将 会 有 更 多 的 缓存 行将 会 从 处 理 器 的 缓存 上 加 载 数据 ， 这 会 增加 访问 内 存 的 延迟 ， 以 及 降 
低 数 据 的 系 能 (与 紧凑 的 数据 存储 地 址 相 比 较 ) 。 


同样 的 ， 如 果 数 据 已 传播 ， 在 给 定 缓存 行 上 就 即 包 含 于 当前 线程 有 关 和 无 关 的 数据 。 在 极端 
情况 下 ， 当 有 更 多 的 数据 存在 于 缓存 中 ， 你 会 对 数据 投 以 更 多 的 关注 ， 而 非 这些 数 据 去 做 了 
什么 。 这 就 会 浪费 宝贵 的 缓存 空间 ， 增 加 处 理 器 缓存 缺失 的 情况 ， 即 使 这 个 数据 项 曾经 在 缓 
存 中 存在 过 ， 还 需要 从 主 存 中 添加 对 应 数据 项 到 缓存 中 ， 因 为 在 缓存 中 其 位 置 已 经 被 其 他 数 
据 所 占有 。 


现在 ， 对 于 单线 程 代 码 来 说 就 很 关键 了 ， 何 至 于 此 呢 ? 原因 就 是 任务 切换 (task switching)。 如 
果 系 统 中 的 线程 数量 要 比 核 芯 多 ， 每 个 核 上 都 要 运行 多 个 线程 。 这 就 会 增加 缓存 的 压力 ， 为 
了 避免 伪 共 享 ， 努 力 让 不 同 线程 访问 不 同 缓存 行 。 因 此 ， 当 处 理 器 切换 线程 的 时 候 ， 就 要 对 
不 同 内 存 行 上 的 数据 进行 重新 加 载 ( 当 不 同 线程 使 用 的 数据 跨越 了 多 个 缓存 行 时 )， 而 非 对 缓存 
中 的 数据 保持 原样 ( 当 线 程 中 的 数据 都 在 同一 缓存 行 时) © 


如 果 线 程 数量 多 于 内 核 或 处 理 器 数量 ， 操 作 系 统 可 能 也 会 选择 将 一 个 线程 安排 给 这 个 核 芯 一 
段 时 间 ， 之 后 再 安排 给 另 一 个 核 芯 一 段 时 间 。 因 此 就 需要 将 缓存 行 从 一 个 内 核 上 ， 转 移 到 另 
一 个 内 核 上 ; 这 样 的 话 ， 就 需要 转移 很 多 缓存 行 ， 也 就 意味 着 要 耗费 很 多 时 间 。 虽 然 ， 操 作 
系统 通常 避免 这 样 的 情况 发 生 ， 不 过 当 其 发 生 的 时 候 ， 对 性 能 就 会 有 很 大 的 影响 。 


当 有 超级 多 的 线程 准备 运行 时 ( 非 等 待 状态 )， 任 务 切换 问题 就 会 频繁 发 生 。 这 个 问题 我 们 之 前 
也 接触 过 : 超额 认购 。 


8.2.5 超额 认购 和 频 莹 的 任务 切换 


多 线程 系统 中 ， 通 常 线程 的 数量 要 多 于 处 理 的 数量 。 不 过 ， 线 程 经 常会 花费 时 间 来 等 待 外 部 
VOR? RRA SIR > REGRESS > FAs 所 以 等 待 不 是 问题 。 应 用 使 用 额外 的 线 
程 来 完成 有 用 的 工作 ， 而 非 让 线程 在 处 理 器 处 以 闲置 状态 时 继续 等 待 。 


这 也 并 非 长 久之 计 ， 如 果 有 很 多 额外 线程 ， 就 会 有 很 多 线程 准备 执行 ， 而 且 数 量 远 远 大 于 可 
用 处 理 器 的 数量 ， 不 过 操作 系统 就 会 忙于 在 任务 间 切 换 ， 以 确保 每 个 任务 都 有 时 间 运 行 。 如 
第 1 章 所 见 ， 这 将 增加 切换 任务 的 时 间 开 销 ， 和 缓存 问题 造成 同一 结果 。 当 无 限制 的 产生 新 线 
程 ， 超 额 认购 就 会 加 剧 ， 如 第 4 章 的 递归 快速 排序 那样 ; 或 者 在 通过 任务 类 型 对 任务 进行 划分 
的 时 候 ， 线 程 数 量 大 于 处 理 器 数量 ， 这 里 对 性 能 影响 的 主要 来 源 是 CPU 的 能 力 ， 而 非 /O。 


如 果 只 是 简单 的 通过 数据 划分 生成 多 个 线程 ， 那 可 以 限定 工作 线程 的 数量 ， 如 8.1.2 节 中 那 
样 。 如 果 超额 认购 是 对 工作 的 天 然 划分 而 产生 ， 那 么 不 同 的 划分 方式 对 这 种 问题 就 没有 太 多 
益处 了 。 之 前 的 情况 是 ， 需 要 选择 一 个 合适 的 划分 方案 ， 可 能 需要 对 目标 平台 有 着 更 加 详细 
的 了 解 ， 不 过 这 也 只 限于 性 能 已 经 无 法 接受 ， 或 是 某 种 划分 方式 已 经 无 法 提高 性 能 的 时 候 。 
其 他 因素 也 会 影响 多 线程 代码 的 性 能 。 即 使 CPU 类 型 和 时 钟 周 期 相同 ， 乒 兵 缓 存 的 开销 可 以 
让 程序 在 两 个 单 核 处 理 器 和 在 一 个 双核 处 理 器 上 ， 产 生 巨 大 的 性 能 差 ， 不 过 这 只 是 那些 对 性 
能 影响 可 见 的 因素 。 接 下 来 ， 让 我 们 看 一 下 这 些 因素 如 何 影响 代码 与 数据 结构 的 设计 。 


8.2 如 何 让 数据 紧凑 ? 
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8.3 为 多 线 程 性 能 设计 数据 结构 


8.1 节 中 ， 我 们 看 到 了 各 种 划分 方法 ; 并 且 在 8.2 节 ， 了 解 了 对 性 能 影响 的 各 种 因素 。 如 何在 设 
计数 据 结构 的 时 候 ， 使 用 这 些 信 息 提高 多 线程 代码 的 性 能 ? 这 里 的 问题 与 第 6、7 章 中 的 问题 
不 同 ， 之 前 是 关于 如 何 设计 能 够 安全 、 并 发 访问 的 数据 结构 。 在 8.2 节 中 ， 单 线程 中 使 用 的 数 
据 布局 就 会 对 性 能 产生 巨大 冲击 (即使 数据 并 未 与 其 他 线程 进行 共享 ) 。 


关键 的 是 ， 当 为 多 线程 性 能 而 设计 数据 结构 的 时 候 ， 需 要 考虑 竞争 (contention)， 伪 共享 (false 
sharing) 和 数据 距离 (data proximity)。 这 三 个 因素 对 于 性 能 都 有 着 重大 的 影响 ， 并 且 你 通常 可 
以 改善 的 是 数据 布局 ， 或 者 将 赋予 其 他 线程 的 数据 元 素 进 行 修 改 。 首 先 ， 让 我 们 来 看 一 个 轻 
松 方案 : 线程 间 划 分 数组 元 素 。 


8.3.1 为 复杂 操作 划分 数组 元 素 


假设 你 有 一 些 偏 数学 计算 任务 ， 比 如 ， 需 要 将 两 个 很 大 的 矩阵 进行 相 乘 。 对 于 抵 阵 相 乘 来 

说 ， 将 第 一 个 矩阵 中 的 首 行 每 个 元 素 和 第 二 个 矩阵 中 首 列 每 个 元 素 相 乘 后 ， 再 相 加 ， 从 而 产 
生 新 矩阵 中 左上 角 的 第 一 个 元 素 。 然 后 ， 第 二 行 和 第 一 列 ， 产 生 新 矩阵 第 一 列 上 的 第 二 个 结 
果 ， 第 二 行 和 第 二 列 ， 产 生 新 矩阵 中 第 二 列 的 第 一 个 结果 ， 以 此 类 推 。 如 图 8.3 所 示 ， 高 亮 展 
示 的 就 是 在 新 矩阵 中 第 二 行 -第 三 列 中 的 元 素 产 生 的 过 程 。 


b1,1 b2 1 
b1,2 b22 
b1,3 bag 


41,1 82,1 a3,1 34,1 …: C1,1 024 C3,1 C44 = 


C12 c22 6a] ca,2 pye 


a1,3 82,3 43,3 44,3 --- C1,3 C2,3 C3,3 C43 = 


al1ma2masma4m … an,m C1,m C2,m C3,m C4,m …: 
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现在 ， 让 我 们 假设 两 个 矩阵 都 有 上 千 行 和 上 千 列 ， 为 了 使 用 多 线程 来 优化 矩阵 乘法 。 通 常 ， 
非 稀 足 和 矩阵 可 以 用 一 个 大 数组 来 代表 ， 也 就 是 第 二 行 的 元 素 紧 随 着 第 一 行 的 ， 以 此 类 推 。 为 
了 完成 矩阵 乘法 ， 这 里 就 需要 三 个 大 数组 。 为 了 优化 性 能 ， 你 需要 仔细 考虑 数据 访问 的 模 
式 ， 特 别 是 向 第 三 个 数组 中 写 入 的 方式 。 


线程 间 划 分 工作 是 有 很 多 种 方式 的 。 假 设 和 矩阵 的 行 或 列 数 量 大 于 处 理 器 的 数量 ， 可 以 让 每 个 
线程 计算 出 结果 矩阵 列 上 的 元 素 ， 或 是 行 上 的 元 素 ， 亦 或 计算 一 个 子 矩 阵 。 


回顾 一 下 8.2.3 和 8.2.4 节 ， 对 于 一 个 数组 来 说 ， 访 问 连续 的 元 素 是 最 好 的 方式 ， 因 为 这 将 会 减 
少 缓存 的 使 用 ， 并 且 降 低 伪 共 享 的 概率 。 如 果 要 让 每 个 线程 处 理 几 行 ， 线 程 需要 读 取 第 一 个 
答 阵 中 的 每 一 个 元 素 ， 并 且 读 取 第 二 个 矩阵 上 的 相关 行 上 的 数据 ， 不 过 这 里 只 需要 对 列 的 值 
进行 写 入 。 给 定 的 两 个 矩阵 是 以 行 连续 的 方式 存储 ， 这 就 意味 着 当 你 访问 第 一 个 矩阵 的 第 一 
行 的 前 N 个 元 素 ， 然 后 是 第 二 行 的 前 N 个 元 素 ， 以 此 类 推 (N 是 列 的 数量 )。 其 他 线程 会 访问 每 行 
的 的 其 他 元 素 ; 很 明显 的 ， 应 该 访问 相 邻 的 列 ， 所 以 从 行 上 读 取 的 N 个 元 素 也 是 连续 的 ， 这 将 
最 大 程度 的 降低 伪 共 享 的 几率 。 当 然 ， 如 果 空 间 已 经 被 N 个 元 素 所 占有 ， 且 N 个 元 素 也 就 是 每 
个 缓存 行 上 具体 的 存储 元 素数 量 ， 就 会 让 伪 共 享 的 情况 消失 ， 因 为 线程 将 会 对 独立 缓存 行 上 
的 数据 进行 操作 。 


另 一 方面 ， 当 每 个 线程 处 理 一 组 行 ， 就 需要 读 取 第 二 个 矩阵 上 的 每 一 个 数据 ， 还 要 读 取 第 一 
个 给 阵 中 的 相关 行 上 的 值 ， 不 过 这 里 只 需要 对 行 上 的 值 进行 写 入 。 因 为 矩阵 是 以 行 连续 的 方 
式 存 储 ， 那 么 现在 可 以 以 N 行 的 方式 访问 所 有 的 元 素 。 如 果 再 次 选择 相 邻 行 ， 这 就 意味 着 线程 
现在 只 能 写 入 N 行 ， 这 里 就 有 不 能 被 其 他 线程 所 访问 的 连续 内 存 块 。 那 么 让 线程 对 每 组 列 进行 
处 理 就 是 一 个 改进 ， 因 为 伪 共 享 只 可 能 有 在 一 个 内 存 块 的 最 后 几 个 元 素 和 下 一 个 元 素 的 开始 
几 个 上 发 生 ， 不 过 具体 的 时 间 还 要 根据 目标 架构 来 决定 。 





第 三 个 选择 将 矩阵 分 成 小 矩阵 块 ? 这 可 以 看 作 先 对 列 进行 划分 ， 再 对 行进 行 划 分 。 

此 ， 划 分 列 的 时 候 ， 同 样 有 伪 共 享 的 问题 存在 。 如 果 你 可 以 选择 内 存 块 所 拥有 行 的 数量 ， 就 
可 以 有 效 的 避免 伪 共 享 ; 将 大 和 矩阵 划分 为 小 块 ， 对 于 读 取 来 说 是 有 好 处 的 : 就 不 再 需要 读 取 
整个 源 和 矩阵 了 。 这 里 ， 只 需要 读 取 目 标 抵 形 里 面相 关 行 列 的 值 就 可 以 了 。 上 有 具体 的 来 看 ， 考 虑 
1,000 行 和 1,000 列 的 两 个 矩阵 相 乘 。 就 会 有 1 百 万 个 元 素 。 如 果 有 100 个 处 理 器 ， 这 样 就 可 以 
每 次 处 理 10 行 的 数据 ， 也 就 是 10,000 个 元 素 。 不 过 ， 为 了 计算 着 10,000 个 元 素 ， 就 需要 对 第 
三 个 矩阵 中 的 全 部 内 容 进行 访问 (1 百 万 个 元 素 )， 再 加 上 10,000 个 相关 行 (第 一 个 矩阵 ) 上 的 元 
素 ， 大 概 就 要 访问 1,010,000 个 元 素 。 另 外 ， 硬 件 能 处 理 100x100 的 数据 块 (总 共 10,000 个 元 
素 )， 这 就 需要 对 第 一 个 矩阵 中 的 100 行 进行 访问 (100x1,000=100,000 个 元 素 )， 还 有 第 二 个 天 
阵 中 的 100 列 (另外 100,000 个 )。 这 才 只 有 200,000 个 元 素 ， 就 需要 五 轮 读 取 才 能 完成 。 如 果 这 
里 读 取 的 元 素 少 一 些 ， 缓 存 缺 失 的 情况 就 会 少 一 些 ， 对 于 性 能 来 说 就 好 一 些 。 

因此 ， 将 矩阵 分 成 小 块 或 正方 形 的 块 ， 要 比 使 用 单线 程 来 处 理 少 量 的 列 好 的 多 。 当 然 ， 可 以 
根据 源 和 矩阵 的 大 小 和 处 理 器 的 数量 ， 在 运行 时 对 块 的 大 小 进行 调整 。 和 之 前 一 样 ， 当 性 能 是 
很 重要 的 指标 ， 就 需要 对 目标 架构 上 的 各 项 指标 进行 测量 。 

如 果 不 做 矩阵 乘法 ， 该 如 何 对 上 面 提 到 的 方案 进行 应 用 呢 ? 同样 的 原理 可 以 应 用 于 任何 情 
况 ， 这 种 情况 就 是 有 很 大 的 数据 块 需要 在 线程 间 进 行 划 分 ; 仔细 观察 所 有 数据 访问 的 各 个 方 
面 ， 以 及 确定 性 能 问题 产生 的 原因 。 各 种 领域 中 ， 出 现 问题 的 情况 都 很 相似 : 改变 划分 方式 
就 能 够 提高 性 能 ， 而 不 需要 对 基本 算法 进行 任何 修改 。 


OK ， 我 们 已 经 了 解 了 访问 数组 是 如 何 对 性 能 产生 影响 的 。 那 么 其 他 类 型 的 数据 结构 呢 ? 


8.3.2 其 他 数据 结构 中 的 数据 访问 模式 


根本 上 讲 ， 同 样 的 考虑 适用 于 想 要 优化 数据 结构 的 数据 访问 模式 ， 就 像 优 化 对 数组 的 访问 : 
。 尝试 调整 数据 在 线程 间 的 分 布 ， 就 能 让 同一 线程 中 的 数据 紧密 联系 在 一 起 。 

。 尝试 减少 线程 上 所 需 的 数据 量 。 

。 尝试 让 不 同 线程 访问 不 同 的 存储 位 置 ， 以 避免 伪 共 享 。 


当然 ， 应 用 于 其 他 数据 结构 上 会 比较 麻烦 。 例 如 ， 对 二 又 树 划分 就 要 比 其 他 结构 困难 ， 有 用 
与 没 用 要 取决 于 树 的 平衡 性 ， 以 及 需要 划分 的 节点 数量 。 同 样 ， 树 的 的 属性 决定 了 其 节点 会 
动态 的 进行 分 配 ， 并 且 在 不 同 的 地 方 进行 释放 。 


现在 ， 节 点 在 不 同 的 地 方 释放 倒 不 是 一 个 严重 的 问题 ， 不 过 这 就 意味 着 处 理 器 需要 在 缓存 中 
存储 很 多 东西 ， 这 实际 上 是 有 好 处 的 。 当 多 线程 需要 旋转 树 的 时 候 ， 就 需要 对 树 中 的 所 有 节 
点 进行 访问 ， 不 过 当 树 中 的 节点 只 包括 指向 实际 值 的 指针 时 ， 处 理 器 只 能 从 主 存 中 对 数据 进 
行 加 载 。 如 果 数 据 正在 被 访问 线程 所 修改 ， 这 就 能 避免 节点 数据 ， 以 及 树 数据 结构 间 的 伪 共 
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这 里 就 和 用 一 个 互 斥 量 来 保护 数据 类 似 了 。 假 设 你 有 一 个 简单 的 类 ， 包 含 一 些 数 据 项 和 一 个 

用 于 保护 数据 的 互 斥 量 (在 多 线程 环境 下 )。 如 果 互 斥 量 和 数据 项 在 内 存 中 很 接近 ， 对 与 一 个 需 
要 获取 互 斥 量 的 线程 来 说 是 很 理想 的 情况 ; 需要 的 数据 可 能 早已 存 入 处 理 器 的 缓存 中 了 ， 

为 在 之 前 为 了 对 互 斥 量 进行 修改 ， 已 经 加 载 了 需要 的 数据 。 不 过 ， 这 还 有 一 个 缺点 : 当 其 他 

线程 党 试 锁 住 互 斥 量 时 (第 一 个 线程 还 没有 是 释放 )， 线 程 就 能 对 对 应 的 数据 项 进行 访问 。 互 斤 
锁 是 当做 一 个 " 读 - 改 - 写 "原子 操 作 实现 的 ， 对 于 相同 位 置 的 操作 都 需要 先 获 取 互 太 量 ， 如 果 互 
斥 量 已 锁 ， 那 就 会 调用 系统 内 核 。 这 种 " 读 - 改 - 写 " 操 作 ， 可 能 会 让 数据 存储 在 缓存 中 ， 让 线程 
获取 的 互 矿 量变 得 毫 无 作用 。 从 目前 互 斥 量 的 发 展 来 看 ， 这 并 不 是 个 问题 ;线程 不 会 直到 互 斤 
量 解锁 ， 才 接触 互 矿 量 。 不 过 ， 当 互 矿 量 共享 同一 缓存 行 时 ， 其 中 存储 的 是 线程 已 使 用 的 数 

据 ， 这 时 拥有 互 斥 量 的 线程 将 会 遭受 到 性 能 打击 ， 因 为 其 他 线程 也 在 尝试 锁 住 互 斥 量 。 


一 种 测试 伪 共 享 问题 的 方法 是 : 对 大 量 的 数据 块 填充 数据 ， 让 不 同 线程 并 发 的 进行 访问 。 比 
如 ， 你 可 以 使 用 : 


struct protected_data 


{ 


std::mutex m; 
char padding[65536]; // 65536 字 节 已 经 超过 一 个 缓存 行 的 数量 级 
my_data data_to_protect; 


ia 


用 来 测试 互 斥 量 竞 争 或 


Struct my_data 
{ 
data_itemi d1; 
data_item2 d2; 
char padding[65536]; 
J; 


my_data some_array[256]; 
用 来 测试 数组 数据 中 的 伪 共 享 。 如 果 这 样 能 够 提高 性 能 ， 你 就 能 知道 伪 共 享 在 这 里 的 确 存 
在 。 


当然 ， 在 设计 并 发 的 时 候 有 更 多 的 数据 访问 模式 需要 考虑 ， 现 在 让 我 们 一 起 来 看 一 些 附 加 的 


注意 事项 。 


8.4 设计 并 发 代码 的 注意 事项 


目前 为 止 ， 在 本 章 中 我 们 已 经 看 到 了 很 多 线程 间 划 分 工作 的 方法 ， 影 响 性 能 的 因素 ， 以 及 这 
些 因素 是 如 何 影 响 你 选择 数据 访问 模式 和 数据 结构 的 。 虽 然 ， 已 经 有 了 很 多 设计 并 发 代码 的 
内 容 。 你 还 需要 考虑 很 多 事情 ， 比 如 异常 安全 和 可 扩展 性 。 随 着 系统 中 核 数 的 增加 ， 性 能 越 
来 越 高 (无 论 是 在 减少 执行 时 间 ， 还 是 增加 吞吐 率 )， 这 样 的 代码 称 为 "可 扩展 "代码 。 理 想 状态 
下 ， 性 能 随 着 核 数 的 增加 线性 增长 ， 也 就 是 当 系 统 有 100 个 处 理 器 时 ， 其 性 能 是 系统 只 有 1 核 
时 的 100 倍 。 


虽然 ， 非 扩展 性 代码 依旧 可 以 正常 工作 一 一 单线 程 应 用 就 无 法 扩展 一 一 例如 ， 蜡 常安 全 是 一 
个 正确 性 问题 。 如 果 你 的 代码 不 是 异常 安全 的 ， 最 终 会 破坏 不 变量 ， 或 是 造成 条 件 竞 争 ， 亦 
或 是 你 的 应 用 意外 终止 ， 因 为 某 个 操作 会 抛 出 异常 。 有 了 这 个 想法 ， 我 们 就 率先 来 看 一 下 异 
常安 全 的 问题 。 


8.4.1 并 行 算 法 中 的 异常 安全 


异常 安全 是 衡量 c++ 代码 一 个 很 重要 的 指标 ， 并 发 代码 也 不 例外 。 实 际 上 ， 相 较 于 串 行 算 
法 ， 并 行 算法 常会 格外 要 求 注 意 异 常 问题 。 当 一 个 操作 在 串 行 算法 中 抛 出 一 个 异常 ， 算 法 只 
需要 考虑 对 其 本 身 进 行 处 理 ， 以 避免 资源 泄露 和 损坏 不 变量 ; 这 里 可 以 允许 异常 传递 给 调用 
者 ， 由 调用 者 对 异常 进行 处 理 。 通 过 对 比 ， 在 并 行 算 法 中 很 多 操作 要 运行 在 独立 的 线程 上 。 
在 这 种 情况 下 ， 有 异常 就 不 再 允许 被 传播 ， 因 为 这 将 会 使 调用 堆栈 出 现 问题 。 如 果 一 个 函数 在 
创建 一 个 新 线程 后 带 着 异常 退出 ， 那 么 这 个 应 用 将 会 终止 。 


作为 一 个 具体 的 例子 ， 让 我 们 回顾 一 下 清单 2.8 中 的 parallel_accumulate 有 函数 : 
清单 8.2 std::accumulate 的 原始 并 行 版 本 ( 源 于 清单 2.8) 


template<typename Iterator,typename T> 
struct accumulate block 


{ 
void operator()(Iterator first,Iterator last,T& result) 
{ 
result=std::accumulate(first,last,result); // 1 
} 
}; 


template<typename Iterator,typename T> 
T parallel_accumulate(Iterator first,Iterator last,T init) 


{ 


unsigned long const length=std::distance(first,last); // 2 


if(!length) 
return init; 


unsigned long const min_per_thread=25; 
unsigned long const max_threads= 
(length+min_per_thread-1)/min_per_thread; 


unsigned long const hardware_threads= 
std::thread: :hardware_concurrency(); 


unsigned long const num_threads= 
std: :min(hardware_threads ! =0? 
hardware_threads:2,max_threads); 


unsigned long const block_size=length/num_threads; 


std::vector<T> results(num_threads); // 3 
std::vector<std::thread> threads(num_threads-1); // 4 


Iterator block_start=first; // 5 
for(unsigned long i=0;i<(num_threads-1);++i) 
{ 
Iterator block_end=block_start; // 6 
std: :advance(block_end, block_size); 
threads[i]=std::thread( // 7 
accumulate_block<Iterator,T>(), 
block_start, block_end, std::ref(results[i])); 
block_start=block_end; // 8 
accumulate_block()(block_start, last, results[num_threads-1]); 
// 9 


std::for_each(threads.begin(),threads.end(), 
std: :mem_fn(&std::thread::join)); 


return std::accumulate(results.begin(),results.end(),init); 
// 10 


} 


现在 让 我 们 来 看 一 下 异常 要 在 哪 抛 出 : 基本 上 就 是 在 调用 有 函数 的 地 方 抛 出 异常 ， 或 在 用 户 定 
义 类 型 上 执行 某 个 操作 时 可 能 抛 出 异常 。 


首先 ， 需 要 调用 distance@， 其 会 对 用 户 定 义 的 迭代 器 类 型 进行 操作 。 因 为 ， 这 时 还 没有 做 任 
何事 情 ， 所 以 对 于 调用 线程 来 说 ， 所 有 事情 都 没 问 题 。 接 下 来 ， 就 需要 分 配 results@ 和 
threads@“。 再 后 ， 调 用 线程 依旧 没有 做 任何 事情 ， 或 产生 新 的 线程 ， 所 以 到 这 里 也 是 没有 问 
题 的 。 当 然 ， 如 果 在 构造 threads 抛 出 异常 ， 那 么 对 已 经 分 配 的 results 将 会 被 清理 ， 析 构 函 数 
会 帮 你 打 理 好 一 切 。 


跳 过 block_start@ 的 初始 化 (因为 也 是 安全 的 )， 来 到 了 产生 新 线程 的 循环 @O@。 当 在 @ 处 创 
建 了 第 一 个 线程 ， 如 果 再 抛 出 异常 ， 就 会 出 问题 的 ; 对 于 新 的 std: :thread 对 象 将 会 销 贷 ， 程 
序 将 调用 std::terminate 来 中 断 程序 的 运行 。 使 用 std::terminate 的 地 方 ， 可 不 是 什么 好 地 
ae 

accumulate_block@ 的 调用 就 可 能 抛 出 异常 ， 就 会 产生 和 上 面 类 似 的 结果 ; 线程 对 象 将 会 被 销 
Re? 并 且 调 用 std::terminate 。 另 一 方面 ， 最 终 调用 std::accumulate 四 可 能 会 抛 出 异常 ， 不 
过 处 理 起 来 没什么 难度 ， 因 为 所 有 的 线程 在 这 里 已 经 汇聚 回 主线 程 了 。 


上 面 只 是 对 于 主线 程 来 说 的 ， 不 过 还 有 很 多 地 方 会 抛 出 异常 : 对 于 调用 accumulate_block 的 
新 线程 来 说 就 会 抛 出 异常 @。 没 有 任何 catch 块 ， 所 以 这 个 异常 不 会 被 处 理 ， 并 且 当 异常 发 生 
的 时 候 会 调用 std::terminater() 来 终止 应 用 的 运行 。 


也 许 这 里 的 异常 问题 并 不 明显 ， 不 过 这 段 代码 是 非 异 常安 全 的 。 
添加 异常 安全 


好 吧 ， 我 们 已 经 确定 所 有 抛 出 异常 的 地 方 了 ， 并 且 知 道 异 常 所 带 来 的 恶性 后 果 。 能 为 其 做 些 
什么 呢 ? 就 让 我 们 来 解决 一 下 在 新 线程 上 的 异常 问题 。 

在 第 4 章 时 已 经 使 用 过 工具 来 做 这 件 事 。 如 果 你 仔细 的 了 解 过 新 线程 用 来 完成 什么 样 的 工作 ， 
要 返回 一 个 计算 的 结果 的 同时 ， 多 许 代码 产生 异常 。 这 可 以 

将 std: :packaged_task 和 std: :future 相 结 合 ， 来 解决 这 个 问题 ° ho RAE 


用 std::packaged_task 重新 构造 代码 ， 代 码 可 能 会 是 如 下 模样 。 


清单 8.3 使 用 std::packaged_task 的 并 行 std::accumulate 


template<typename Iterator, typename T> 
struct accumulate_block 


{ 
T operator()(Iterator first,Iterator last) // 1 
{ 
return std::accumulate(first,last,T()); // 2 
} 


a 


template<typename Iterator,typename T> 
T parallel_accumulate(Iterator first,Iterator last,T init) 


{ 


unsigned long const length=std::distance(first, last); 


if(!length) 
return init; 


unsigned long const min_per_thread=25; 
unsigned long const max_threads= 
(Llength+min_per_thread-1)/min_per_thread; 


unsigned long const hardware_threads= 
std::thread: :hardware_concurrency(); 


unsigned long const num_threads= 
std: :min(hardware_threads ! =0? 
hardware_threads:2,max_threads); 


unsigned long const block_size=length/num_threads; 


std::vector<std::future<T> > futures(num_threads-1); // 3 
std::vector<std::thread> threads(num_threads-1); 


Iterator block_start=first; 
for(unsigned long i=0;i<(num_threads-1);++i) 
{ 
Iterator block_end=block_start; 
std: :advance(block_end, block_size); 
std: :packaged_task<T(Iterator,Iterator)> task( // 4 
accumulate_block<Iterator,T>()); 
futures[i]=task.get_future(); // 5 


threads[i]=std::thread(std::move(task),block_start,block_end); 
// 6 
block_start=block_end; 


} 
T last_result=accumulate_block()(block_start,last); // 7 


std::for_each(threads.begin(),threads.end(), 
std: :mem_fn(&std::thread::join)); 


T result=init; // 8 
for(unsigned long i=0;i<(num_threads-1);++i) 
{ 
resultt+=futures[i].get(); // 9 
} 
result += last_result; // 10 
return result; 


第 一 个 修改 就 是 调用 accumulate_block 的 操作 现在 就 是 直接 将 结果 返回 ， 而 非 使 用 引用 将 结 
果 存 储 在 某 个 地 方 @ 。 使 用 std: :packaged_task 和 std::future 是 线程 安全 的 ， 所 以 你 可 以 使 
用 它们 来 对 结果 进行 转移 。 当 调用 std::accumulate OIT > $ RAR È mAh A THI RUH E R 
数 ， 而 非 复 用 result 的 值 ， 不 过 这 只 是 一 个 小 改动 。 


下 一 个 改动 就 是 ， 不 用 向 量 来 存储 结果 ， 而 使 用 futures 向 量 为 每 个 新 生 线 程 存 

ti std::future<T> @@。 在 新 线程 生成 循环 中 ， 首 先 要 为 accumulate_block 创 建 一 个 任务 

@。 std::packaged_task<T(Iterator,Iterator)> 声明 ， 需 要 操作 的 两 个 lterators 和 一 个 想 要 获 
取 的 T。 然 后 ， 从 任务 中 获取 future@， 再 将 需要 处 理 的 数据 块 的 开始 和 结束 信息 传 入 @@， 让 
新 线程 去 执行 这 个 任务 。 当 任务 执行 时 ，future 将 会 获取 对 应 的 结果 ， 以 及 任何 抛 出 的 异常 。 


使 用 future， 就 不 能 获得 o ， 所 以 需要 将 最 终 数据 块 的 结果 赋 给 一 个 变量 进行 保 
存 @ 加 ， 而 非 对 一 个 数组 进行 填 楷 。 同 样 ， 因 为 需要 从 future 中 获取 结果 ， 使 用 简单 的 for 循 环 ， 
就 要 比 使 用 std::accumulate 好 的 多 ; 循环 从 提供 的 初始 值 开始 @@， 并 且 将 每 个 future 上 的 值 

进行 累加 加 。 如 果 相 关 任 务 抛 出 一 个 异常 ， 那 么 异常 就 会 被 future 捕 捉 到 ， 并 且 使 用 get() 的 时 
候 获 取 数 据 时 ， 这 个 异常 会 再 次 抛 出 。 最 后 ， 在 返回 结果 给 调用 者 之 前 ， 将 最 后 一 个 数据 块 

上 的 结果 添加 入 结果 中 国 。 


这 样 ， 一 个 问题 就 已 经 解决 : 在 工作 线程 上 抛 出 的 异常 ， 可 以 在 主线 程 上 抛 出 。 如 果 不 止 一 
个 工作 线程 抛 出 异常 ， 那 么 只 有 一 个 能 在 主线 程 中 抛 出 ， 不 过 这 不 会 有 产生 太 大 的 问题 。 如 
果 这 个 问题 很 重要 ， 你 可 以 使 用 类 似 std: :nested exception 来 对 所 有 抛 出 的 异常 进行 捕捉 。 


剩 下 的 问题 就 是 ， 当 生成 第 一 个 新 线程 和 当 所 有 线程 都 汇 入 主线 程 时 ， 抛 出 异常 ; 这 样 会 让 
线程 产生 泄露 。 最 简单 的 方法 就 是 捕获 所 有 抛 出 的 线程 ， 汇 入 的 线程 依 昌 是 joinable() 的 ， 并 
且 会 再 次 抛 出 异常 : 


try 


{ 
for(unsigned long i=0;i<(num_threads-1);++i) 
{ 
// ... as before 
} 


T last_result=accumulate_block()(block_start,last); 


std::for_each(threads.begin(),threads.end(), 
std::mem_fn(&std::thread::join)); 


} 

catch(...) 

{ 
for(unsigned long i=0;i<(num_thread-1);++i) 
{ 


if(threads[i].joinable() ) 
thread[i].join(); 
} 


throw; 


现在 好 了 ， 无 论 线 程 如 何 离 开 这 段 代码 ， 所 有 线程 都 可 以 被 汇 入 。 不 过 ，try-catch 很 不 美观 ， 
并 且 这 里 有 重复 代码 。 可 以 将 “正常 "控制 流 上 的 线程 在 catch 块 上 执行 的 线程 进行 汇 入 。 重 复 
代码 是 没有 必要 的 ， 因 为 这 就 意味 着 更 多 的 地 方 需要 改变 。 不 过 ， 现 在 让 我 们 来 提取 一 个 对 
象 的 析 构 函数 ; 毕竟 ， 析 构 函 数 是 c++ 中 处 理 资源 的 惯用 方式 。 看 一 下 你 的 类 : 


class join_threads 
{ 
std::vector<std::thread>& threads; 
public: 
explicit join_threads(std::vector<std::thread>& threads_): 
threads(threads_) 
{} 
~join_threads() 
{ 
for(unsigned long i=0;i<threads.size();++i) 
{ 
if(threads[i].joinable()) 
threads[i].join(); 


} 
Hy 


这 个 类 和 在 清单 2.3 中 看 到 的 thread_guard 类 很 相似 ， 除 了 使 用 向 量 的 方式 来 扩展 线程 量 。 用 


这 个 类 简化 后 的 代码 如 下 所 示 : 


清单 8.4 异常 安全 版 std::accumulate 


template<typename Iterator,typename T> 
T parallel_accumulate(Iterator first,Iterator last,T init) 


{ 


unsigned long const length=std::distance(first, last); 


if(!length) 
return init; 


unsigned long const min_per_thread=25; 
unsigned long const max_threads= 
(Length+min_per_thread-1)/min_per_thread; 


unsigned long const hardware_threads= 
std::thread: :hardware_concurrency(); 


unsigned long const num_threads= 
std: :min(hardware_threads ! =0? 
hardware_threads:2,max_threads); 


unsigned long const block_size=length/num_threads; 


std::vector<std::future<T> > futures(num_threads-1); 
std::vector<std::thread> threads(num_threads-1); 
join_threads joiner(threads); // 1 


Iterator block_start=first; 
for(unsigned long i=0;i<(num_threads-1);++i) 
{ 
Iterator block_end=block_start; 
std: :advance(block_end, block_size); 
std: :packaged_task<T(Iterator,Iterator)> task( 
accumulate_block<Iterator,T>()); 
futures[i]=task.get_future(); 


threads[i]=std::thread(std: :move(task),block_start, block_end); 

block_start=block_end; 

} 

T last_result=accumulate_block()(block_start, last); 

T result=init; 

for(unsigned long i=0;i<(num_threads-1);++i) 

{ 
result+=futures[i].get(); // 2 

} 

result += last_result; 

return result; 


当 创 建 了 线程 容器 ， 就 对 新 类 型 创建 了 一 个 实例 @， 可 让 退出 线程 进行 汇 入 。 然 后 ， 可 以 再 显 
式 的 汇 入 循环 中 将 线程 删除 ， 在 原理 上 来 说 是 安全 的 : 因为 线程 ， 无 论 怎么 样 退出 ， 都 需要 
汇 入 主线 程 。 注 意 这 里 对 futures[il.get()@ 的 调用 ， 将 会 阻塞 线程 ， 直 到 结果 准备 就 绪 ， 所 以 
这 里 不 需要 显 式 的 将 线程 进行 汇 入 。 和 清单 8.2 中 的 原始 代码 不 同 : 原始 代码 中 ， 你 需要 将 线 
程 汇 入 ， 以 确保 results 向 量 被 正确 填充 。 不 仅 需 要 异常 安全 的 代码 ， 还 需要 较 短 的 函数 实 

现 ， 因 为 这 里 已 经 将 汇 入 部 分 的 代码 放 到 新 (可 复 用 ) 类 型 中 去 了 。 


std::async() 的 异常 安全 


现在 ， 你 已 经 了 解 了 ， 当 需要 显 式 管理 线程 的 时 候 ， 需 要 代码 是 异常 安全 的 。 那 现在 让 我 们 
来 看 一 下 使 用 std::async() 是 怎 么 样 完成 异常 安全 的 e 在 本 例 中 ， 标准 库 对 线程 进行 了 较 好 
的 管理 ， 并 且 当 “期 望 "处 以 就 绪 状 态 的 时 候 ， 就 能 生成 一 个 新 的 线程 。 对 于 异常 安全 ， 还 需要 


注意 一 件 事 ， 如 果 在 没有 等 待 的 情况 下 对 “期 望 " 实 例 进 行销 毁 ， 析 构 函 数 会 等 待 对 应 线程 执行 
完毕 后 才 执 行 。 这 就 能 桥 面 的 必 过 线程 泄露 的 问题 ， 因 为 线程 还 在 执行 ， 且 持 有 数据 的 引 
用 。 下 面 的 代码 将 展示 使 用 std::async() 完成 异常 安全 的 实现 。 


清单 8.5 异常 安全 并 行 版 std: :accumulate 使 用 std::async() 





template<typename Iterator,typename T> 
T parallel_accumulate(Iterator first,Iterator last,T init) 
{ 

unsigned long const length=std::distance(first,last); // 1 

unsigned long const max_chunk_size=25; 

if (Length<=max_chunk_size) 

{ 

return std::accumulate(first,last,init); // 2 

} 

else 

{ 

Iterator mid_point=first; 

std: :advance(mid_point, length/2); // 3 

std::future<T> first_half_result= 

std::async(parallel_accumulate<Iterator,T>, // 4 
first,mid_point, init); 

T 
second_half_result=parallel_accumulate(mid_point,last,T()); // 
5 

return first_half_result.get()+second_half_result; // 6 


这 个 版 本 对 数据 进行 递归 划分 ， 而 非 在 预计 算 后 对 数据 进行 分 块 ; 因此 ， 这 个 版 本 要 比 之 前 
的 版 本 简单 很 多 ， 并 且 这 个 版 本 也 是 蜡 常安 全 的 。 和 之 前 一 样 ， 一 开始 要 确定 序列 的 长 度 @， 
如 果 其 长 度 小 于 数据 块 包 含 数据 的 最 大 数量 ， 那 么 可 以 直接 调用 std::accumulate @。 如 果 元 
素 的 数量 超出 了 数据 块 包 含 数据 的 最 大 数量 ， 那 么 就 需要 找到 数量 中 点 国 ， 将 这 个 数据 块 分 成 
两 部 分 ， 然 后 再 生成 一 个 异步 任务 对 另 一 半数 据 进 行 处 理 @。 第 二 半 的 数据 是 通过 直接 的 递归 
调用 来 处 理 的 回 ， 之 后 将 两 个 块 的 结果 加 和 到 一 起 @@。 标 准 库 能 保证 std: async 的 调用 能 够 
充分 的 利用 硬件 线程 ， 并 且 不 会 产生 线程 的 超额 认购 ， 一 些 “ 异 步 "调用 是 在 调用 get()@ 后 同步 
执行 的 。 

优雅 的 地 方 ， 不 仅 在 于 利用 硬件 并 发 的 优势 ， 并 且 还 能 保证 异常 安全 。 如 果 有 异常 在 递归 调 


用 回 中 抛 出 ， 通 过 调用 std::async 图 所 产生 的 “期望 "， 将 会 在 异常 传播 时 被 销毁 。 这 就 需要 依 
次 等 待 异步 任务 的 完成 ， 因 此 也 能 避免 悬空 线程 的 出 现 。 另 外 ， 当 异步 任务 抛 出 异常 ， 且 被 


future 所 捕获 ， 在 对 get()@ 调 用 的 时 候 ，future 中 存储 的 异常 ， 会 再 次 抛 出 。 


除 此 之 外 ， 在 设计 并 发 代码 的 时 候 还 要 考虑 哪些 其 他 因素 ? 让 我 们 来 看 一 下 扩展 性 
(scalability)。 随 着 系统 中 核 数 的 增加 ， 应 用 性 能 如 何 提升 ? 


8.4.2 可 扩展 性 和 Amdahl 定 律 


扩展 性 代表 了 应 用 利用 系统 中 处 理 器 执行 任务 的 能 力 。 一 种 极端 就 是 将 应 用 写 死 为 单线 程 运 
行 ， 这 种 应 用 就 是 完全 不 可 扩展 的 ; 即使 添加 了 100 个 处 理 器 到 你 的 系统 中 ， 应 用 的 性 能 都 不 
会 有 任何 改变 。 另 一 种 就 是 像 SETI@Home[3] 项 目 一 样 ， 让 应 用 使 用 系统 中 成 千 上 万 的 处 理 
器 (以 个 人 电脑 的 形式 加 入 网 络 的 用 户 ) 成 为 可 能 。 


对 于 任意 的 多 线程 程序 ， 在 程序 运行 的 时 候 ， 和 运行 的 工作 线程 数量 会 有 所 不 同 。 应 用 初始 阶 
段 只 有 一 个 线程 ， 之 后 会 在 这 个 线程 上 衍生 出 新 的 线程 。 理 想 状态 : 每 个 线程 都 做 着 有 用 的 
工作 ， 不 过 这 种 情况 几乎 是 不 可 能 发 生 的 。 线 程 通常 会 花 时 间 进 行 互相 等 待 ， 或 等 待 JO 操 作 
的 完成 。 


一 种 简化 的 方式 就 是 就 是 将 程序 划分 成 “ 串 行 "部 分 和 “并行 部分。 串 行 部 分 : 只 能 由 单线 程 执 
行 一 些 工作 的 地 方 。 并 行 部 分 : 可 以 让 所 有 可 用 的 处 理 器 一 起 工作 的 部 分 。 当 在 多 处 理 系统 
上 运行 你 的 应 用 时 ，“ 并 行 "部 分 理论 上 会 完成 的 相当 快 ， 因 为 其 工作 被 划分 为 多 份 ， 放 在 不 同 
的 处 理 器 上 执行 。“ 串 行 "部 分 则 不 同 ， 还 是 只 能 一 个 处 理 器 执行 所 有 工作 。 这 样 (简化 ) 假 设 
下 ， 就 可 以 对 随 着 处 理 数量 的 增加 ， 估 计 一 下 性 能 的 增益 : 当 程序 “ 串 行 "部 分 的 时 间 用 fs 来 表 
示 ， 那 么 性 能 增益 (P) 就 可 以 通过 处 理 器 数量 (N) 进 行 估计 : 


P= - 
Is + y 


这 就 是 Amdahl 定 律 ， 在 讨论 并 发 程序 性 能 的 时 候 都 会 引用 到 的 公式 。 如 果 每 行 代码 都 能 并 行 
化 ， 串 行 部 分 就 为 0， 那 么 性 能 增益 就 为 N。 或 者 ， 当 串 行 部 分 为 1/3 时 ， 当 处 理 器 数量 无 限 增 
长 ， 你 都 无 法 获得 超过 3 的 性 能 增益 。 








Amdahl 定 律 明确 了 ， 对 代码 最 大 化 并 发 可 以 保证 所 有 处 理 器 都 能 用 来 做 有 用 的 工作 。 如 果 
将 * 囊 行 "部 分 的 减 小 ， 或 者 减少 线程 的 等 待 ， 就 可 以 在 多 处 理 器 的 系统 中 获取 更 多 的 性 能 收 
益 。 或 者 ， 当 能 提供 更 多 的 数据 让 系统 进行 处 理 ， 并 且 让 并 行 部 分 做 最 重要 的 工作 ， 就 可 以 
减少 " 吕 行 "部 分 ， 以 获取 更 高 的 性 能 增益 。 


扩展 性 : 当 有 更 多 的 处 理 器 加 入 时 ， 减 少 一 个 动作 的 执行 时 间 ， 或 在 给 定时 间 内 做 更 多 工 
作 。 有 时 这 两 个 指标 是 等 价 的 (如 果 处 理 器 的 速度 相当 快 ， 那 么 就 可 以 处 理 更 多 的 数据 )， 有 时 
不 是 。 选 择 线程 间 的 工作 划分 的 技术 前 ， 辨 别 哪些 方面 是 能 否 扩展 的 就 十 分 的 重要 。 


本 节 开 始 已 经 提 到 ， 线 程 并 非 任 何 时 候 都 做 的 是 有 用 的 工作 。 有 时 ， 它 们 会 等 待 其 他 线程 ， 
或 者 等 待 JO 完 成 ， 亦 或 是 等 待 其 他 的 事情 。 如 果 线 程 在 等 待 的 时 候 ， 系 统 中 还 有 必要 的 任务 
需要 完成 时 ， 就 可 以 将 等 待 " 隐 藏 "> 起 来 。 


8.4.3 使 用 多 线程 隐藏 延迟 


之 前 讨论 了 很 多 有 关 多 线程 性 能 的 话题 。 现 在 假设 ， 线 程 在 一 个 处 理 器 上 运行 时 不 会 偷懒 ， 
并 且 做 的 工作 都 很 有 有 用。 当然 ， 这 只 是 假设 ; 在 实际 应 用 中 ， 线 程 会 经 常 因为 等 待 某 些 事情 
而 阻塞 。 


不 论 等 待 的 理由 是 什么 ， 如 果 有 和 系统 中 物理 单元 相同 数量 的 线程 ， 那 么 线程 阻塞 就 意味 着 
在 等 待 CPU 时 间 片 。 处 理 器 将 会 在 阻塞 的 时 间 内 运行 另 一 个 线程 ， 而 不 是 什么 事情 都 不 做 。 
因此 ， 当 知道 一 些 线程 需要 像 这 样 耗 费 相 当 一 段 时 间 进 行 等 待 时 ， 可 以 利用 CPU 的 空闲 时 间 
去 运行 一 个 或 多 个 线程 。 


试想 一 个 病毒 扫描 程序 ， 使 用 流水 线 对 线程 间 的 工作 进行 划分 。 第 一 个 线程 对 文件 系统 中 的 
文件 进行 检查 ， 并 将 它们 放 入 一 个 队列 中 。 同 时 ， 另 一 个 线程 从 队列 中 获取 文件 名 ， 加 载 文 
件 ， 之 后 对 它们 进行 病毒 扫描 。 线 程 对 文件 系统 中 的 文件 进行 扫描 就 会 受到 I/O 操 作 的 限制 ， 
所 以 可 以 通过 执行 额外 的 扫描 线程 ， 充 分 利用 CPU 的 “空闲 "时 间 。 这 时 还 需要 一 个 文件 搜索 线 
程 ， 以 及 足够 多 的 扫描 线程 。 当 扫描 线程 为 了 扫描 文件 ， 还 要 从 磁盘 上 读 取 到 重要 部 分 的 文 
件 时 ， 就 能 体会 到 多 扫描 线程 的 意义 所 在 了 。 不 过 ， 在 某 些 时 候 线 程 也 过 于 多 ， 系 统 将 会 因 
为 越 来 越 多 的 任务 切换 而 降低 效率 ， 就 像 8.2.5 节 描述 的 那样 。 


同 之 前 一 样 ， 这 也 是 一 种 优化 ， 对 修改 (线程 数量 ) 前 后 性 能 的 测量 很 重要 ; 优化 的 线程 数量 高 
度 依赖 要 完成 工作 的 先天 属性 ， 以 及 等 待 时 间 所 占 的 百分比 。 


应 用 可 能 不 用 额外 的 线程 ， 而 使 用 CPU 的 空闲 时 间 。 例 如 ， 如 果 一 个 线程 因为 JO 操 作 被 阻 

塞 ， 这 个 线程 可 能 会 使 用 异步 JO( 如 果 可 以 用 的 话 )， 当 IO 操作 在 后 台 执 行 完 成 后 ， 线 程 就 可 
以 做 其 他 有 用 的 工作 了 。 在 其 他 情况 下 ， 当 一 个 线程 等 待 其 他 线程 去 执行 一 个 操作 时 ， 比 起 
阻塞 ， 不 如 让 阻塞 线程 自己 来 完成 这 个 操作 ， 就 像 在 第 7 章 中 看 到 的 无 锁 队 列 那样 。 在 一 个 极 
端的 例子 中 ， 当 一 个 线程 等 待 一 个 任务 完成 ， 并 且 这 个 任务 还 没有 被 其 他 任何 线程 所 执行 

时 ， 等 待 线程 就 可 以 执行 这 个 任务 ， 或 执行 另 一 个 不 完整 的 任务 。 在 清单 8.1 中 看 到 这 样 的 例 
子 ， 排 序 函 数 持续 的 尝试 对 数据 进行 排序 ， 即 使 那些 数据 已 经 不 需要 排序 了 。 


比 起 添加 线程 数量 让 其 对 处 理 器 进行 充分 利用 ， 有 时 也 要 在 增加 线程 的 同时 ， 确 保 外 部 事件 
被 及 时 的 处 理 ， 以 提高 系统 的 响应 能 力 


o 


4.4 使 用 并 发 提高 响应 能 


很 多 流行 的 图 形 化 用 户 接口 框架 都 是 事件 驱动 型 (event driven) ; 对 图 形 化 接口 进行 操作 是 通 
过 按 下 按键 或 移动 鼠标 进行 ， 将 产生 一 系列 需要 应 用 处 理 的 事件 或 信息 。 系 统 也 可 能 产生 信 
息 或 事件 。 为 了 确定 所 有 事件 和 信息 都 能 被 正确 的 处 理 ， 应 用 通常 会 有 一 个 事件 循环 ， 就 像 
下 面 的 代码 : 


while(true) 
{ 
event_data event=get_event(); 
if(event.type==quit ) 
break; 
process(event); 


显然 ，API 中 的 细节 可 能 不 同 ， 不 过 结构 通常 是 一 样 的 : 等 待 一 个 事件 ， 对 其 做 必要 的 处 理 ， 
之 后 等 待 下 一 个 事件 。 如 果 是 一 个 单线 程 应 用 ， 那 么 就 会 让 长 期 任务 很 难 书 写 ， 如 同 在 8.1.3 
节 中 所 描述 。 为 了 确保 用 户 输入 被 及 时 的 处 理 ， 无 论 应 时 在 做 些 什么 ，get_event() 和 
process() 必 须 以 合理 的 频率 调用 。 这 就 意味 着 任务 要 被 周 anos 并 且 返 回 到 事件 循环 
中 ， 或 get_ event()/process() 必 须 在 一 个 合适 地 方 进行 调用 。 每 个 选项 的 复杂 程度 取决 于 任务 
的 实现 方式 。 

通过 使 用 并 发 分 BAe We ERNE eet ee T ed 
GUI 线程 来 处 理 这 些 事 件 。 线 程 可 以 通过 简单 的 机 制 进行 通讯 ， 而 不 是 将 事件 处 理 代码 和 任务 
代码 混在 一 起 。 下 面 的 例子 就 是 展示 了 这 样 的 分 离 。 


清单 8.6 将 GUI 线 程 和 任务 线程 进行 分 离 


std::thread task_thread; 
std::atomic<bool> task_cancelled(false); 


void gui_thread() 
{ 
while(true) 
{ 
event_data event=get_event(); 
if(event.type==quit ) 


break; 
process(event); 


} 
} 
void task() 
{ 
while(!task_complete() && !task_cancelled) 
{ 
do_next_operation(); 
} 
if(task_cancelled) 
{ 
perform_cleanup(); 
} 
else 
{ 
post_gui_event(task_complete); 
} 
} 
void process(event_data const& event) 
{ 
switch(event.type) 
{ 


case start_task: 
task_cancelled=false; 
task_thread=std: :thread( task); 
break; 

case stop_task: 
task_cancelled=true; 
task_thread.join(); 
break; 

case task_complete: 
task_thread.join(); 
display_results(); 
break; 

default: 
Nee: 


通过 这 种 方式 对 关注 进行 分 离 ， 用 户 线程 将 总 能 及 时 的 对 事件 进行 响应 ， 及 时 完成 任务 需要 
花费 很 长 事件 。 使 用 应 用 的 时 候 ， 响 应 事件 通常 也 是 影响 用 户 体验 的 重要 一 点 ; 无 论 是 特定 
操作 被 不 恰当 的 执行 (无 论 是 什么 操作 )， 应 用 都 会 被 完全 锁 住 。 通 过 使 用 专门 的 事件 处 理 线 
> GUI 就 能 处 理 GUI 指 定 的 信息 了 (比如 对 于 调整 窗口 的 大 小 或 颜色 )， 而 不 需要 中 断 处 理 
器 ， 进 行 耗 时 的 处 理 ; 同时 ， 还 能 向 长 期 任务 传递 相关 的 信息 。 


Re 


现在 ， 你 可 以 将 本 章 中 在 设计 并 发 代码 时 要 考虑 的 所 有 问题 进行 一 下 回顾 。 作 为 一 个 整体 ， 
它们 都 很 具有 代表 性 ， 不 过 当 你 熟练 的 使 用 “多 线程 编程 "时 ， 考 虑 其 中 的 很 多 问题 将 变 成 你 习 
惯 。 如 果 你 是 初学 者 ， 我 希望 这 些 例子 能 让 你 明白 ， 这 些 问题 是 如 何 影响 多 线程 代码 的 。 


[3] http://setiathome.ssl.berkeley.edu/ 


8.5 在 实践 中 设计 并 发 代码 


当 为 一 个 特殊 的 任务 设计 并 发 代码 时 ， 需 要 根据 任务 本 身 来 考虑 之 前 所 提 到 的 问题 。 为 了 展 
示 以 上 的 注意 事项 是 如 何 应 用 的 ， 我 们 将 看 一 下 在 c++ 标准 库 中 三 个 标准 函数 的 并 行 实现 。 
当 你 遇 到 问题 时 ， 这 里 的 例子 可 以 作为 很 好 的 参照 。 在 有 较 大 的 并 发 任务 进行 辅助 下 ， 我 们 
也 将 实现 一 些 函数 。 


我 主要 演示 这 些 实现 使 用 的 技术 ， 不 过 可 能 这 些 技术 并 不 是 最 先进 的 ; 更 多 优秀 的 实现 可 以 
更 好 的 利用 硬件 并 发 ， 不 过 这 些 实现 可 能 需要 到 与 并 行 算法 相关 的 学 术 文 献 ， 或 者 是 多 线程 
的 专家 库 中 (比如 : Inter 的 TBB[4]) 才 能 看 到 。 


并 行 版 的 std::for_each 可 以 看 作为 能 最 直观 体现 并 行 概念 ， 就 让 我 们 从 并 行 版 
的 std::for_each 开始 吧 | 


8.5.1 并 行 实现 : std::for_each 


std::for_each 的 原理 很 简单 : 其 对 某 个 范围 中 的 元 素 ， 依 次 调用 用 户 提供 的 函数 。 并 行 和 串 
行 调用 的 最 大 区 别 就 是 函数 的 调用 顺序 。 std::for_each 是 对 范围 中 的 第 一 个 元 素 调 用 用 户 函 

数 ， 接 着 是 第 二 个 ， 以 此 类 推 ， 而 在 并 行 实现 中 对 于 每 个 元 素 的 处 理 顺 序 就 不 能 保证 了 ， 并 
且 它 们 可 能 (我 们 希望 如 此 ) 被 并 发 的 处 理 。 


为 了 实现 这 个 函数 的 并 行 版 本 ， 需 要 对 每 个 线程 上 处 理 的 元 素 进 行 划 分 。 你 事先 知道 元 素数 
量 ， 所 以 可 以 处 理 前 对 数据 进行 划分 ( 详 见 8.1.1 节 ) 。 Pee 行 ， 就 可 以 使 

用 std::thread: :hardware concurrency () 来 决定 线程 的 数量 。 同 样 ， ARARA EE 被 独立 的 处 
理 ， 所 以 可 以 使 用 连续 的 数据 块 来 避免 伪 共 享 ( 详 见 8.2.3 节 )。 


这 里 的 算法 有 点 类 似 于 并 行 版 的 std::accumulate ( 详 见 8.4.1 节 )， 不 过 比 起 计算 每 一 个 元 素 的 
加 和 ， 这 里 对 每 个 元 素 仅仅 使 用 了 一 个 指定 功能 的 函数 。 因 为 不 需要 返回 结果 ， 可 以 假设 这 
可 能 会 对 简化 代码 ， 不 过 想 要 将 异常 传递 给 调用 者 ， 就 需要 使 

用 std: :packaged_task 和 std::future 机 制 对 线程 中 的 异常 ; 进行 转移 。 这 里 展示 一 个 样本 实 

现 。 


清单 8.7 并 行 版 std: :for_each 
template<typename Iterator,typename Func> 


void parallel_for_each(Iterator first,Iterator last,Func f) 


{ 


unsigned long const length=std::distance(first,last); 


if(!length) 


return, 


unsigned long const min_per_thread=25; 
unsigned long const max_threads= 
(length+min_per_thread-1)/min_per_thread; 


unsigned long const hardware_threads= 
std:: thread: :hardware_concurrency(); 


unsigned long const num_threads= 
std: :min(hardware_threads ! =0? 
hardware_threads:2,max_threads); 


unsigned long const block_size=length/num_threads; 


std::vector<std::future<void> > futures(num_threads-1); // 
std::vector<std::thread> threads(num_threads-1); 
join_threads joiner(threads); 


Iterator block_start=first; 
for(unsigned long i1=0;i<(num_threads-1);++i) 
{ 
Iterator block_end=block_start; 
std: :advance(block_end, block_size); 
std: :packaged_task<void(void)> task( // 2 
[=]() 
{ 
std::for_each(block_ start,block_end,f); 
+); 
futures[i]=task.get_future(); 
threads[i]=std::thread(std::move(task)); // 3 
block_start=block_end; 
} 
std::for_each(block_start, last, f); 
for(unsigned long i=0;i<(num_threads-1);++i) 
x 
futures[i].get(); // 4 


代码 结构 与 清单 8.4 的 差不多 。 最 重要 的 不 同 在 于 futures 向 量 对 std::future<void> XAO X È 
进行 存储 ， 因 为 工作 线程 不 会 返回 值 ， 并 且 简 单 的 lambda 函 数 会 对 block_start 到 block_end 上 
的 任务 执行 {函数 。 这 是 为 了 避免 传 入 线程 的 构造 函数 辆 。 当 工作 线程 不 需要 返回 一 个 值 

时 ， 调 用 futures[il.get()@ 只 是 提供 检索 工作 线程 异常 的 方法 ; 如 果 不 想 把 异常 传递 出 去 ， 就 
可 以 省 略 这 一 步 。 


实现 并 行 std::accumulate 的 时 候 ， 使 用 std::async 会 简化 代码 ; 同样 ，parallel for_each 也 
可 以 使 用 std::async 。 实 现 如 下 所 示 。 


清单 8.8 使 用 std: :async 实现 std: :for_each 


template<typename Iterator,typename Func> 
void parallel_for_each(Iterator first,Iterator last,Func f) 


{ 


unsigned long const length=std::distance(first, last); 


if(!length) 
return; 


unsigned long const min_per_thread=25; 


if (length<(2*min_per_thread) ) 

{ 
std: :for_each(first,last,f); // 1 

} 

else 

{ 
Iterator const mid_point=first+length/2; 
std::future<void> first_half= // 2 

std::async(&parallel_for_each<Iterator, Func>, 
first,mid_point,f); 

parallel_for_each(mid_point,last,f); // 3 
first_half.get(); // 4 


和 基于 std::async 的 parallel_accumulate( 清 单 8.5) 一 样 ， 是 在 运行 时 对 数据 进行 迭代 划分 
的 ， 而 非 在 执行 前 划分 好 ， 这 是 因为 你 不 知道 你 的 库 需 要 使 用 多 少 个 线程 。 像 之 前 一 样 ， 当 
你 将 每 一 级 的 数据 分 成 两 部 分 ， 异 步 执 行 另 外 一 部 分 @， 剩 下 的 部 分 就 不 能 再 进行 划分 了 ， 所 
以 直接 运行 这 一 部 分 四 ; 这 样 就 可 以 直接 对 std::for_each 进行 使 用 了 。 这 里 再 次 使 

用 std: :async 和 std::future 的 get() 成 员 BA@ RAG FH YEA © 


回 到 和 工法， 函数 需要 对 每 一 个 元 素 执行 同样 的 操作 (这 样 的 操作 有 很 多 种 ， 初 学 者 可 
到 std::count 和 std::replace ) ， 一 个 稍微 复杂 一 些 的 例子 就 是 使 用 std::find ° 


8.5.2 并 行 实现 : std: :find 


接 下 来 是 std::find 算法 ， 因 为 这 是 一 种 不 需要 对 数据 元 素 做 任何 处 理 的 算法 。 比 如 ， 当 第 

那 就 没有 必要 对 其 他 元 素 进 行 搜索 了 。 将 会 看 到 ， 算 法 属性 对 于 
能 具有 很 大 的 影响 ， 并 且 对 并 行 实现 的 设计 有 着 直接 的 影响 。 这 个 工法 是 一 个 很 特别 的 例 

fa ， 数 据 访问 模式 都 会 对 代码 的 设计 产生 影响 ( 详 见 8.3.2 节 )。 该 类 中 的 另 一 些 算 法 包 

括 std: :equal 和 std: :any_of ° 


当 你 和 妻子 或 者 搭档 ， 在 一 个 纪念 鲍 中 找寻 一 张 老 照片 ， 当 找到 这 张 照片 时 ， 就 不 会 再 看 另 
外 的 照片 了 。 不 过 ， 你 得 让 其 他 人 知道 你 已 经 找到 照片 了 (比如 ， 大 喊 一 声 “ 找 到 了 1”)， 这 样 
其 他 人 就 会 停止 搜索 了。 很 多 算法 的 特 ， ee 所 以 它们 没有 办 法 
像 std: :find 一 样 ， 一 旦 找到 合适 数据 就 停止 执行 。 因 此 ， 你 需要 设计 代码 对 其 进行 使 用 
一 一 当 得 到 想 要 的 答案 就 中 断 其 他 任务 的 执行 ， a 下 的 元 素 进行 处 
理 。 


如 果 不 中 断 其 他 线程 ， 那 么 串 行 版 本 的 性 能 可 能 会 超越 并 行 版 ， 因 为 串 行 算法 可 以 在 找到 匹 
配 元 素 的 时 候 ， 停 止 搜索 并 返回 。 如 果 系 统 能 支持 四 个 并 发 线程 ， 那 么 每 个 线程 就 可 以 对 总 
数据 量 的 1/4 进 行 检查 ， 并 且 在 我 们 的 实现 只 需要 单 核 完成 的 1/4 的 时 间 ， 就 能 完成 对 所 有 元 素 
的 查找 。 如 果 匹 配 的 元 素 在 第 一 个 1/4 块 中 ， 串 行 算法 将 会 返回 第 一 个 ， 因 为 工法 不 需要 对 剩 
下 的 元 素 进行 处 理 了 。 


一 种 办 法 ， so A 
元 素 后 就 对 这 个 标识 进行 检查 。 如 果 标 识 被 设置 ， 那 么 就 有 线程 找到 了 匹配 元 素 ， 所 以 算法 
且 在 更 多 的 情况 下 ， 相 较 于 串 行 方式 ， 性 能 能 提升 很 多 。 缺 点 就 是 ， 加 载 原子 变量 是 一 个 很 
慢 的 操作 ， 会 阻碍 每 个 线程 的 运行 。 


如 何 返回 值 和 传播 异常 呢 ? 现在 你 有 两 个 选择 。 你 可 以 使 用 一 个 future 数 组 ， 使 

用 std: :packaged_task 来 转移 值 和 异常 ， 在 主线 程 上 对 返 ee 或 者 使 

用 std::promise 对 工作 线程 上 的 最 终结 果 直 接 进 行 设 置 。 这 完全 依赖 于 你 想 怎 么 样 处 理工 作 
线程 上 的 异常 。 如 果 想 停止 第 一 个 异常 (即使 还 没有 对 所 有 元 素 进行 处 理 )， 就 可 以 使 

用 std::promise 对 异常 和 最 终 值 进行 设置 。 另 外 ， 如 果 想 要 让 其 他 工作 线程 继续 查找 ， 可 以 
使 用 std::packaged_task 来 存储 所 有 的 异常 ， 当 线程 没有 找到 匹配 元 素 时 ， 异 常 将 再 次 抛 

出 。 


这 种 ， 情况 下 ， ， 我 会 选 先 择 std: :promise ， 因为 其 行为 和 std: :find 更 为 接近 。 这 里 需要 注意 一 
下 搜索 的 元 素 是 不 是 在 提供 的 搜索 范围 内 。 因 此 ， 在 所 有 线程 结束 前 ， 获 取 future 上 的 结果 。 
如 果 被 future 阻 塞 住 ， 所 要 查找 的 值 不 在 范围 内 ， 就 会 持续 的 等 待 下 去 。 实 现代 码 如 下 。 


清单 8.9 并 行 find 算 法 实现 


template<typename Iterator,typename MatchType> 
Iterator parallel_find(Iterator first,Iterator last,MatchType 
match) 


{ 
struct find_element // 1 
{ 
void operator()(Iterator begin,Iterator end, 
MatchType match, 
std: :promise<Iterator>* result, 
std: :atomic<bool>* done_flag) 
{ 
try 
{ 
for(;(begin!=end) && !done_flag->load();++begin) // 2 
{ 
if (*begin==match) 
{ 
result->set_value(begin); // 3 
done_flag->store(true); // 4 
return; 
} 
} 
} 
catch 5 
{ 
try 
{ 
result->set_exception(std::current_exception()); // 6 
done_flag->store(true); 
} 
catehi e D T/T 
{} 
} 
} 
}; 


unsigned long const length=std::distance(first,last); 


if(!length) 
return last; 


unsigned long const min_per_thread=25; 
unsigned long const max_threads= 
(Llength+min_per_thread-1)/min_per_thread; 


unsigned long const hardware_threads= 
std:: thread: :hardware_concurrency(); 


unsigned long const num_threads= 
std: :min(hardware_threads !=0? 
hardware_threads:2,max_threads); 


unsigned long const block_size=length/num_threads; 


std::promise<Iterator> result; // 8 
std::atomic<bool> done_flag(false); // 9 
std::vector<std::thread> threads(num_threads-1); 
{ // 10 

join_threads joiner(threads); 


Iterator block_start=first; 
for(unsigned long i=0;i<(num_threads-1);++i) 
{ 
Iterator block_end=block_start; 
std::advance(block_end, block_size); 
threads[i]=std::thread(find_element(), // 11 
block_start, block_end, match, 
&result, &done_flag); 
block_start=block_end; 
} 
find_element()(block_start,last,match, &result, &done_flag); 
fig Z 
} 
if(!done_flag.load()) //13 
{ 


return last; 


} 
return result.get_future().get(); // 14 


清单 8.9 中 的 函数 主体 与 之 前 的 例子 相似 。 这 次 ， 由 find_element 类 @ 的 函数 调用 操作 实现 ， 
来 完成 查找 工作 的 。 循 环 通过 在 给 定数 据 块 中 的 元 素 ， 检 查 每 一 步 上 的 标识 @@。 如 果 匹 配 的 元 
素 被 找到 ， 就 将 最 终 的 结果 设置 到 promise 国 当中 ， 并 且 在 返回 前 对 done_flag@ 进 行 设置 。 


如 果 有 一 个 异常 被 抛 出 ， 那 么 它 就 会 被 通用 处 理 代码 回 捕 获 ， 并 且 在 promise@@ 尝 中 试 存 储 
前 ， 对 done flag 进 行 设置 。 如 果 对 应 promise 已 经 被 设置 ， 设 置 在 promise 上 的 值 可 能 会 抛 出 
一 个 异常 ， 所 以 这 里 加 发 生 的 任何 异常 ， 都 可 以 捕获 并 丢弃 。 


这 意味 着 ， 当 线程 调用 find_element 查 询 一 个 值 ， 或 者 抛 出 一 个 异常 时 ， 如 果 其 他 线程 看 到 
done flag 被 设置 ， 那 么 其 他 线程 将 会 终止 。 如 果 多 线程 同时 找到 匹配 值 或 抛 出 异常 ， 它 们 将 
会 对 promise 产 生 竞 争 。 不 过 ， 这 是 良性 的 条 件 竞争 ; 因为 ， 成 功 的 竞争 者 会 作为 "第 一 个 " 返 
回 线 程 ， 因 此 这 个 结果 可 以 接受 。 


回 到 parallel_find 哆 数 本 身 ， 其 拥有 用 来 停止 搜索 的 promise@ 和 标识 @; 随 着 对 范围 内 的 元 素 
的 查找 (DD，promise 和 标识 会 传递 到 新 线程 中 。 主 线程 也 使 用 find_element 来 对 剩 下 的 元 素 进 
行 查找 9。 像 之 前 提 到 的 ， 需 要 在 全 部 线程 结束 前 ， 对 结果 进行 检查 ， 因 为 结果 可 能 是 任意 
位 置 上 的 匹配 元 素 。 这 里 将 “启动 - 汇 入 "代码 放 在 一 个 块 中 国 ， 所 以 所 有 线程 都 会 在 找到 匹配 元 
素 时 (3 进行 汇 入 。 如 果 找 到 匹配 元 素 ， 就 可 以 调用 std::future<Iterator> (X Á promised4) 49 
成 员 函 数 get() 来 获取 返回 值 或 异常 。 


不 过 ， 这 里 假设 你 会 使 用 硬件 上 所 有 可 用 的 的 并 发 线程 ， 或 使 用 其 他 机 制 对 线程 上 的 任务 进 
行 提 前 划分 。 就 像 之 前 一 样 ， 可 以 使 用 std: :async ， 以 及 递归 数据 划分 的 方式 来 简化 实现 ( 同 
时 使 用 c++ 标准 库 中 提供 的 自动 缩放 工具 )。 使 用 std::async 的 parallel find 实 现 如 下 所 示 。 


清单 8.10 使 用 std::async 实现 的 并 行 find 算 法 


template<typename Iterator,typename MatchType> // 1 
Iterator parallel_find_impl(Iterator first,Iterator 
last,MatchType match, 

std: :atomic<bool>& done) 


try 
{ 
unsigned long const length=std::distance(first, last); 
unsigned long const min_per_thread=25; // 2 
if(length<(2*min_per_thread)) // 3 
{ 
for(;(first!=last) && !done.load();++first) // 4 


{ 
if(*first==match) 


done=true; // 5 
return first; 


} 
return last; // 6 


} 
else 
{ 
Iterator const mid_ point=first+(length/2); // 7 
std::future<Iterator> async_result= 
std: :async(&parallel_find_impl<Iterator,MatchType>, // 


8 
mid_point, last,match, std::ref(done) ); 
Iterator const direct_result= 
parallel find_impl(first,mid_point,match,done); // 9 
return (direct_result==mid_point )? 
async_result.get():direct_result; // 10 
} 
} 
catch(...) 
{ 
done=true; // 11 
throw; 
} 
} 


template<typename Iterator,typename MatchType> 
Iterator parallel_find(Iterator first,Iterator last,MatchType 
match) 
{ 
std::atomic<bool> done(false); 
return parallel _find_impl(first,last,match,done); // 12 


如 果 想 要 在 找到 匹配 项 时 结束 ， 就 需要 在 线程 之 间 设 置 一 个 标识 来 表明 匹配 项 已 经 被 找到 。 
因此 ， 需 要 将 这 个 标识 递归 的 传递 。 通 过 函数 四 的 方式 来 实现 是 最 简单 的 办 法 ， 只 需要 增加 一 
个 参数 一 一 一 个 done 标 识 的 引用 ， 这 个 表示 通过 程序 的 主 入 口 点 传 入 加。 


核心 实现 和 之 前 的 代码 一 样 。 通 常 函 数 的 实现 中 ， 会 让 单个 线程 处 理 最 少 的 数据 项 @ ; 如 果 数 
据 块 大 小 不 足 于 分 成 两 半 ， 就 要 让 当前 线程 完成 所 有 的 工作 了 加。 实际 算法 在 一 个 简单 的 循环 
当中 (给 定 范围 )， 直 到 在 循环 到 指定 范围 中 的 最 后 一 个 ， 或 找到 匹配 项 ， 并 对 标识 进行 设置 

图 。 如 果 找 到 匹配 项 ， 标 识 done 就 会 在 返回 前 进行 设置 回 。 无 论 是 因为 已 经 查找 到 最 
个 ， 还 是 因为 其 他 线程 对 done 进 行 了 设置 ， 都 会 停止 查找 。 如 果 没 有 找到 ， 会 将 最 后 
素 last 进 行 返 回 @。 


已 一 
Pg 


个 元 


如 果 给 定 范围 可 以 进行 划分 ， 首 先 要 在 st::async 在 对 第 二 部 分 进行 查找 加 前 ， 要 找 数 据 中 点 
四 ， 而 且 需 要 使 用 std::ref 将 done 以 引用 的 方式 传递 。 同 时 ， 可 以 通过 对 第 一 部 分 直接 进行 
递归 查找 。 两 部 分 都 是 异步 的 ， 并 且 在 原始 范围 过 大 时 ， 直 接 递 归 查 找 的 部 分 可 能 会 再 细 

化 。 


如 果 直 接 查找 返回 的 是 mid_point， 这 就 意味 着 没有 找到 匹配 项 ， 所 以 就 要 从 异步 查找 中 获取 
结果 。 如 果 在 另 一 半 中 没有 匹配 项 的 话 ， 返 回 的 结果 就 一 定 是 last， 这 个 值 的 返回 就 代表 了 没 
有 找到 匹配 的 元 素 四 。 如 果 " 异 步 "调用 被 延迟 ( 非 趴 正 的 异步 )， 那 么 实际 上 这 里 会 运行 get() ; 

这 种 情况 下 ， 如 果 对 下 半 部 分 的 元 素 搜 索 成 功 ， 那 么 就 不 会 执行 对 上 半 部 分 元 素 的 搜索 了 。 

如 果 蜡 步 查 找 丨 实 的 运行 在 其 他 线程 上 ， 那 么 async_result 变 量 的 析 构 郊 数 将 会 等 待 该 线程 完 
成 ， 所 以 这 里 不 会 有 线程 泄露 。 


像 之 前 一 样 ， std: :async 可 以 用 来 提供 “异常 -安全 ”和 “异常 -传播 "特性 。 如 果 直 接 递 归 抛 出 弄 

常 ，future 的 析 构 函数 就 能 让 异步 执行 的 线程 提前 结束 ; 如 果 异 步调 用 抛 出 异常 ， 那 么 这 个 异 
常 将 会 通过 对 get() 成 员 函 数 的 调用 进行 传播 四 。 使 用 try/catch 块 只 能 捕 提 在 done 发 生 的 异 

常 ， 并 且 当 有 异常 抛 出 四 时 ， 所 有 线程 都 能 很 快 的 终止 运行 。 不 过 ， 不 使 用 icatch 的 实现 依 
日 没 问题 ， 不 同 的 就 是 要 等 待 所 有 线程 的 工作 是 否 完成 。 


实现 中 一 个 重要 的 特性 就 是 ， 不 能 保证 所 有 数据 都 能 被 std::find 串 行 处 理 。 其 他 并 行 算法 
可 以 借鉴 这 个 特性 ， 因 为 要 让 一 个 算法 并 行 起 来 这 是 必须 具有 的 特性 。 如 果 有 顺序 问题 ， 元 
素 就 不 能 并 发 的 处 理 了 。 如 果 每 个 元 素 独 立 ， 虽 然 对 于 parallel for each 不 是 很 重要 ， 不 过 对 
于 parallel find， 即 使 在 开始 部 分 已 经 找到 了 匹配 元 素 ， 也 有 可 能 返回 范围 中 最 后 一 个 元 素 ; 
如 果 在 知道 结果 的 前 提 下 ， 这 样 的 结果 会 让 人 很 惊讶 。 


OK， 现 在 你 已 经 使 用 了 并 行 化 的 std: :find 。 如 在 本 节 开 始 说 的 那样 ， 其 他 相似 算法 不 需要 
对 每 一 个 数据 元 素 进行 处 理 ， 并 且 同 样 的 技术 可 以 使 用 到 这 些 类 似 的 算法 上 去 。 我 们 将 在 第 9 
章 中 看 到 “中 断 线程 "的 问题 。 


为 了 完成 我 们 的 并 行 “三 重奏 *， 我 们 将 换 一 个 角度 来 看 一 下 std::partial_sum 。 对 于 这 个 算 
法 ， 没 有 太 多 的 文献 可 参考 ， 不 过 让 这 个 算法 并 行 起 来 是 一 件 很 有 趣 的 事 。 


8.5.3 并 行 实现 : std::partial_sum 


std::partial_sum 会 计算 给 定 范围 中 的 每 个 元 素 并 用 计算 后 的 结果 将 原始 序列 中 的 值 替换 
掉 。 比 如 ， 有 一 个 序列 [1，2，3，4，5]， 在 执行 该 算法 后 会 成 为 : [1，3(1+2)，6(1+2+3) > 
10(1+2+3+4)，15(1+2+3+4+5)]。 让 这 样 一 个 莫 法 并 行 起 来 会 很 有 趣 ， 因 为 这 里 不 能 讲 任务 分 
块 ， 对 每 一 块 进行 独立 的 计算 。 比 如 ， 原 始 序 列 中 的 第 一 个 元 素 需 要 加 到 后 面 的 一 个 元 素 中 
去 。 


确定 某 个 范围 部 分 和 的 一 种 的 方式 ， 就 是 在 独立 块 中 计算 部 分 和 ， 然 后 将 第 一 块 中 最 后 的 元 
素 的 值 ， 与 下 一 块 中 的 所 有 元 素 进 行 相 加 ， 依 次 类 推 。 如 果 有 个 序列 [1，2，3，4，5，6， 
7，8，9]， 然 后 将 其 分 为 三 块 ， 那 么 在 第 一 次 计算 后 就 能 得 到 [{{1，3，6}， 人 {，9，15}，{17， 
15° 24) 。 然 后 将 6( 第 一 块 的 最 后 一 个 元 素 ) 加 到 第 二 个 块 中 ， 那 么 就 得 到 [{1，3，6}，{10， 
15，21}，{7，15，24}]。 然 后 再 将 第 二 块 的 最 后 一 个 元 素 21 加 到 第 三 块 中 去 ， 就 得 到 [{1， 
3 > 6}? {10 > 15 > 21} {28° 36 > 55}] ° 


将 原始 数据 分 割 成 块 ， 加 上 之 前 块 的 部 分 和 就 能 够 并 行 了 。 如 果 每 个 块 中 的 末尾 元 素 都 是 第 
一 个 被 更 新 的 ， 那 么 块 中 其 他 的 元 素 就 能 被 其 他 线程 所 更 新 ， 同 时 另 一 个 线程 对 下 一 块 进行 
更 新 ， 等 等 。 当 处 理 的 元 素 比 处 理 核心 的 个 数 多 的 时 候 ， 这 样 完成 工作 没 问 题 ， 因 为 每 一 个 
核 芯 在 每 一 个 阶段 都 有 合适 的 数据 可 以 进行 处 理 。 


如 果 有 很 多 的 处 理 器 (就 是 要 比 处 理 的 元 素 个 数 多 )， 那 么 之 前 的 方式 就 无 法 正常 工作 了 。 如 果 
还 是 将 工作 划分 给 每 个 处 理 器 ， 那 么 在 第 一 步 就 没 必 要 去 做 了 。 这 种 情况 下 ， 传 递 结果 就 意 
味 着 让 处 理 器 进行 等 待 ， 这 时 需要 给 这 些 处 于 等 待 中 的 处 理 器 一 些 工作 。 所 以 ， 可 以 采用 完 
全 不 同 的 方式 来 处 理 这 个 问题 。 比 起 将 数据 块 中 的 最 后 一 个 元 素 的 结果 向 后 面 的 元 素 块 伟 
递 ， 可 以 对 部 分 结果 进行 传播 : 第 一 次 与 相 邻 的 元 素 (距离 为 1) 相 加 和 (和 之 前 一 样 )， 之 后 和 距 
离 为 2 的 元 素 相 加 ， 在 后 来 和 距离 为 4 的 元 素 相 加 ， 以 此 类 推 。 比 如 ， 初 始 序列 为 [1 ，2，3， 
4，5，6，7，8，9]， 第 一 次 后 为 [1，3，5，7，9，11，13，15，17]， 第 二 次 后 为 [1，3， 
6，10，14，18, 22，26，30]， 下 一 次 就 要 隔 4 个 元 素 了 。 第 三 次 后 [1 3, 6, 10, 15, 21, 28, 
36, 44]， 下 一 次 就 要 隔 8 个 元 素 了 。 第 四 次 后 [1, 3, 6, 10, 15, 21, 28, 36, 45]， 这 就 是 最 终 的 结 
果 。 虽 然 ， 比 起 第 一 种 方法 多 了 很 多 步骤 ， 不 过 在 可 并 发 平台 下 ， 这 种 方法 提高 了 并 行 的 可 
行 性 ; 每 个 处 理 器 可 在 每 一 步 中 处 理 一 个 数据 项 。 


总 体 来 说 ， 当 有 N 个 操作 时 (每 步 使 用 一 个 处 理 器 ) 第 二 种 方法 需要 log(N)[ 底 为 2] 步 ; 在 本 节 

中 ，N 就 相当 于 数据 链表 的 长 度 。 比 起 第 一 种 ， 每 个 线程 对 分 配 块 做 N/k 个 操作 ， 然 后 在 做 N/k 
次 结果 传递 (这 里 的 k 是 线程 的 数量 )。 因 此 ， 第 一 种 方法 的 时 间 复 杂 度 为 O(N)， 不 过 第 二 种 方 
法 的 时 间 复 杂 度 为 Q(Nlog(N))。 当 数据 量 和 处 理 器 数量 相近 时 ， 第 二 种 方法 需要 每 个 处 理 器 上 
log(N) 个 操作 ， 第 一 种 方法 中 每 个 处 理 器 上 执行 的 操作 数 会 随 着 k 的 增加 而 增多 ， 因 为 需要 对 
结果 进行 传递 。 对 于 处 理 单元 较 少 的 情况 ， 第 一 种 方法 会 比较 合适 ; 对 于 大 规模 并 行 系统 ， 
第 二 种 方法 比较 合适 。 


不 管 怎 么 样 ， 先 将 效率 问题 放 一 边 ， 让 我 们 来 看 一 些 人 代码。 下面 清单 实现 的 ， 就 是 第 一 种 方 
法 。 


清单 8.11 使 用 划分 的 方式 来 并 行 的 计算 部 分 和 


template<typename Iterator> 
void parallel_partial_sum(Iterator first,Iterator last) 


{ 
typedef typename Iterator::value_type value_type; 


struct process_chunk // 1 
{ 
void operator()(Iterator begin,Iterator last, 
std: :future<value_type>* previous_end_value, 
std: :promise<value_type>* end_value) 


try 


Iterator end=last; 
++end; 
std::partial_sum(begin,end,begin); // 2 
if(previous_end_value) // 3 
{ 
value_type& addend=previous_end_value->get(); // 4 
*last+=addend; // 5 
if(end_value) 
{ 
end_value->set_value(*last); // 6 
} 
std::for_each(begin, last, [addend](value_type& item) 
M U 


item+=addend; 
H); 
} 


else if(end_value) 


{ 


end_value->set_value(*last); // 8 


} 
Catch /9 


{ 


if(end_value) 


{ 


end_value->set_exception(std::current_exception()); 


// 10 
} 


else 


{ 
throw; // 11 


} 
Fi 


unsigned long const length=std::distance(first, last); 


if(!length) 
return last; 


unsigned long const min_per_thread=25; // 12 
unsigned long const max_threads= 
(length+min_per_thread-1)/min_per_thread; 


unsigned long const hardware_threads= 
std:: thread: :hardware_concurrency(); 


unsigned long const num_threads= 
std: :min(hardware_threads !=0? 
hardware_threads:2,max_threads); 


unsigned long const block_size=length/num_threads; 


typedef typename Iterator::value_type value_type; 


std::vector<std::thread> threads(num_threads-1); // 13 
std::vector<std: :promise<value_type> > 
end_values(num_threads-1); // 14 
std::vector<std::future<value_type> > 
previous_end_values; // 15 
previous_end_values.reserve(num_threads-1); // 16 
join_threads joiner(threads); 


Iterator block_start=first; 
for(unsigned long i=0;i<(num_threads-1); ++i) 


Iterator block_last=block_start; 
std: :advance(block_last,block_size-1); // 17 
threads[i]=std::thread(process_chunk(), // 18 
block_start,block_last, 
(i!=0)?&previous_end_values[i-1]:0, 
&end_values[i]); 
block_start=block_last; 
++block_start; // 19 
previous_end_values.push_back(end_values[i].get_future()); 
// 20 
} 
Iterator final_element=block_start; 
std: :advance(final_element, std: :distance(block_start,last)-1); 
// 21 
process_chunk()(block_start,final_element, // 22 
(num_threads>1)?&previous_end_values.back():0, 
0); 


这 个 实现 中 ， 使 用 的 结构 体 和 之 前 算法 中 的 一 样 ， 将 问题 进行 分 块 解决 ， 每 个 线程 处 理 最 小 
的 数据 块 (2。 其 中 ， 有 一 组 线程 4 和 一 组 promise( 人 DD， 用 来 存储 每 块 中 的 最 后 一 个 值 ; 并 且 实 
现 中 还 有 一 组 future45， 用 来 对 前 一 块 中 的 最 后 一 个 值 进行 检索 。 可 以 为 future(@ 做 些 储 备 ， 
以 避免 生成 新 线程 时 ， 再 分 配 内 存 。 


eens 前 一 样 ， 不 过 这 次 是 让 和 迭代 器 指向 了 每 个 数据 块 的 最 后 一 个 元 素 ， 而 不 是 作为 一 

普通 值 传递 到 最 后 (7?)， 这 样 就 方便 向 其 他 块 传递 当前 块 的 最 后 一 个 元 素 了 。 实 际 处 理 是 在 
oe oe 完成 的 ， 这 个 结构 体 看 上 去 不 是 很 长 ; 当前 块 的 开始 和 结束 迭代 器 
和 前 块 中 最 后 一 个 值 的 future 一 起 ， 作 为 参数 进行 传递 ， 并 且 promise 用 来 保留 当前 范围 内 最 
后 一 个 值 的 原始 值 (8。 


生成 新 的 线程 后 ， 就 对 开始 块 的 ID 进行 更 新 ， 别 忘 了 传递 最 后 一 个 元 素 49， 并 且 将 当前 块 的 
最 后 一 个 元 素 存 储 到 future， 上 面 的 数据 将 在 循环 中 再 次 使 用 到 CO0 © 


在 处 理 最 后 一 个 数据 块 前 ， 需 要 获取 之 前 数据 块 中 最 后 一 个 元 素 的 迭代 器 (21)， 这 样 就 可 以 将 

其 作为 参数 传 入 process_chunk(22) 中 了 。 std::partial_sun 不 会 返回 一 个 值 ， 所 以 在 最 后 一 
个 数据 块 被 处 理 后 ， 就 不 用 再 做 任何 事情 了 。 当 所 有 线程 的 操作 完成 时 ， 求 部 分 和 的 操作 也 
就 算 完成 了 。 


OK， 现 在 来 看 一 下 process_chunk 哆 数 对 象 @@。 对 于 整 块 的 处 理 是 始 于 
对 std: :partial_sum 的 调用 ， 包括 对 于 最 后 一 个 值 的 处 理 @， 不 过 得 要 知道 当前 块 是 否 是 第 
一 块 @。 如 果 当 前 块 不 是 第 一 块 ， 就 会 有 一 个 previous_end _value 值 从 前 面 的 块 传 过 来 ， 所 以 


这 里 需要 等 待 这 个 值 的 产生 四 。 为 了 将 算法 最 大 程度 的 并 行 ， 首 先 需 要 对 最 后 一 个 元 素 进 行 更 


新 四 ， 这 样 你 就 能 将 这 个 值 传 递 给 下 一 个 数据 块 (如 果 有 下 一 个 数据 块 的 话 )@@。 当 完成 这 个 操 
作 ， 就 可 以 使 用 std: :for_each 和 简单 的 lambda 部 数 加 对 剩余 的 数据 项 进行 更 新 。 


如 果 previous_end _ value 值 为 室 ， 当 前 数据 块 就 是 第 一 个 数据 块 ， 所 以 只 需要 为 下 一 个 数据 
块 更 新 end_value@( 如 果 有 下 一 个 数据 块 的 话 当前 数据 块 可 能 是 唯一 的 数据 块 )。 





最 后 ， 如 果 有 任意 一 个 操作 抛 出 异常 ， 就 可 以 将 其 捕获 回 ， 并 且 存 入 promise@， 如 果 下 一 个 
数据 块 尝试 获取 前 一 个 数据 块 的 最 后 一 个 值 四 时 ， 异 常会 再 次 抛 出 。 处 理 最 后 一 个 数据 块 时 ， 
异常 会 全 部 重新 抛 出 个 ， 因 为 抛 出 动作 一 定 会 在 主线 程 上 进行 。 


因为 线程 间 需 要 同步 ， 这 里 的 代码 就 不 容 多 使 用 std::async 重 写 。 任 务 等 待 会 让 线程 中 途 去 
执行 其 他 的 任务 ， 所 以 所 有 的 任务 必须 同时 执行 。 

基于 块 ， 以 传递 末尾 元 素 值 的 方法 就 介绍 到 这 里 ， 让 我 们 来 看 一 下 第 二 种 计算 方式 。 

实现 以 2 的 需 级 数 为 距离 部 分 和 算法 


第 二 种 算法 通过 增加 距离 的 方式 ， 让 更 多 的 处 理 器 充分 发 挥 作 用 。 在 这 种 情况 下 ， 没 有 进 一 
步 同步 的 必要 了 ， 因 为 所 有 中 间 结 果 都 直接 传递 到 下 一 个 处 理 器 上 去 了 。 不 过 ， 在 实际 中 我 
们 很 少见 到 ， 单 个 处 理 器 处 理 对 一 定数 量 的 元 素 执 行 同 一 条 指令 ， 这 种 方式 成 为 单 指令 -多 数 
据 流 (SIMD)。 因 此 ， 代 码 必 须 能 处 理 通用 情况 ， 并 且 需 要 在 每 步 上 对 线程 进行 显 式 同步 。 





完成 这 种 功能 的 一 种 方式 是 使 用 栅栏 (barrier) 一 一 一 种 同步 机 制 : 只 有 所 有 线程 都 到 达 栅 栏 
处 ， 才 能 进行 之 后 的 操作 ; 先 到 达 的 线程 必须 等 待 未 到 达 的 线程 。 cr+ 11 标 准 库 没有 直接 提 
供 这 样 的 工具 ， 所 以 你 得 自行 设计 一 个 。 


试想 游乐 场 中 的 过 山 车 。 如 果 有 适量 的 游客 在 等 待 ， 那 么 过 山 车 管理 员 就 要 保证 ， 在 过 山 车 
启动 前 ， 每 一 个 位 置 都 得 坐 一 个 游客 。 栅 栏 的 工作 原理 也 一 样 : 你 已 经 知道 了 “座位 "的 数量 ， 
线程 就 是 要 等 待 所 有 "座位 ?都 坐 满 。 当 等 待 线程 够 数 ， 那 么 它们 可 以 继续 运行 ; 这 时 ， 栅 栏 会 
重 置 ， 并 且 会 让 下 一 拨 线 程 开 始 托 带 。 通 常 ， 会 在 循环 中 这 样 做 ， 当 同一 个 线程 再 次 到 达 栅 
栏 处 ， 它 会 再 次 等 待 。 这 种 方法 是 为 了 让 线程 同步 ， 所 以 不 会 有 线程 在 其 他 未 完成 的 情况 

下 ， 就 去 完成 下 一 个 任务 。 如 果 有 线程 提前 执行 ， 对 于 这 样 一 个 算法 ， 就 是 一 场 灾 难 ， 因 为 
提前 出 发 的 线程 可 能 会 修改 要 被 其 他 线程 使 用 到 的 数据 ， 后 面 线程 获取 到 的 数据 就 不 是 正确 
数据 了 。 


下 面 的 代码 就 简单 的 实现 了 一 个 栅栏 。 


清单 8.12 简单 的 栅栏 类 


class barrier 
{ 
unsigned const count; 
std::atomic<unsigned> spaces; 
std: :atomic<unsigned> generation; 
public: 
explicit barrier(unsigned count_): // 1 
count (count_),spaces(count), generation(0) 


{} 


void wait() 

{ 
unsigned const my_generation=generation; // 2 
if(!--spaces) // 3 


{ 
spaces=count; // 4 
++generation; // 5 
} 
else 
{ 
while(generation==my_generation) // 6 
std::this_thread::yield(); // 7 
} 
} 
J; 


这 个 实现 中 ， 用 一 定数 量 的 "座位 "构造 了 一 个 barrier@， 这 个 数量 将 会 存储 Count 变量 中 。 起 
初 ， 栅 栏 中 的 spaces 与 count 数 量 相 当 。 当 有 线程 都 在 等 待 时 ，spaces 的 数量 就 会 减少 国 。 妆 
spaces 的 数量 减 到 0 时 ，spaces 的 值 将 会 重 置 为 count@， 并 且 generation 变 量 会 增加 ， 以 向 
线程 发 出 信号 ， 让 这 些 等 待 线程 能 够 继续 运行 @@。 如 果 Spaces 没 有 到 达 0， 那 么 线程 会 继续 等 
待 。 这 个 实现 使 用 了 一 个 简单 的 自 旋 锁 @ 回 ， 对 generation 的 检查 会 在 wait() 开 始 的 时 候 进 行 
@。 因 为 generation 只 会 在 所 有 线程 都 到 达 栅 栏 的 时 候 更 新 回 ， 在 等 待 的 时 候 使 用 yield()@ 就 
不 会 让 CPU 处 于 忙 等 待 的 状态 。 


这 个 实现 比较 “简单 "的 站 实 意义 : 使 用 自 旋 等 待 的 情况 下 ， 如 果 让 线程 等 待 很 长 时 间 就 不 会 很 
理想 ， 并 且 如 果 超 过 count 数 量 的 线程 对 wait() 进 行 调用 ， 这 个 实现 就 没有 办 法 工作 了 。 如 果 想 
要 很 好 的 处 理 这样 的 情况 ， 必 须 使 用 一 个 更 加 健壮 (更 加 复杂 ) 的 实现 。 我 依 占 坚持 对 原子 变量 
操作 顺序 的 一 致 性 ， 因 为 这 会 让 事情 更 加 简单 ， 不 过 有 时 还 是 需要 放松 这 样 的 约束 。 全 局 同 
步 对 于 大 规模 并 行 架构 来 说 是 消耗 巨大 的 ， 因 为 相关 处 理 器 会 穿梭 于 存储 栅栏 状态 的 缓存 行 
中 (可 见 8.2.2 中 对 乒 兵 缓存 的 讨论 )， 所 以 需要 格外 的 小 心 ， 来 确保 使 用 的 是 最 佳 同 步 方法 。 


不 论 怎 么 样 ， 这 些 都 需要 你 考虑 到 ; 需要 有 固定 数量 的 线程 执行 同步 循环 。 好 吧 ， 大 多 数 情 
况 下 线程 数量 都 是 固定 的 。 你 可 能 还 记得 ， 代 码 起 始 部 分 的 几 个 数据 项 ， 人 
到 其 最 终 值 。 这 就 意味 着 ， ermine naw 包围 内 的 所 有 元 素 ， 还 是 让 栅栏 来 同 
步 线程 ， 都 会 递减 count 的 值 。 我 会 选择 后 者 ， 因 为 其 能 避免 线程 做 不 必要 的 工作 ， 仅 仅 是 等 
待 最 终 步 又 完 成 。 


ee 
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std: :atomic<unsigned> count; 


初始 化 保持 不 变 ， 不 过 当 spaces 的 值 被 重 置 后 ， 你 需要 显 式 的 对 count 进 行 load() 操 作 : 


spaces=count.load(); 


这 就 是 要 对 wait() 函 数 的 改动 ; 现在 需要 一 个 新 的 成 员 部 数 来 递减 count。 这 个 函数 命名 为 
done_waiting()， 因 为 当 一 个 线程 完成 其 工作 ， 并 在 等 待 的 时 候 ， 才 能 对 其 进行 调用 它 


void done_waiting() 
{ 
--count; // 1 
if(!--spaces) // 2 
{ 
spaces=count.load(); // 3 
++generation; 


实现 中 ， 首 先 要 减少 count@， 所 以 下 一 次 Spaces 将 会 被 重 置 为 一 个 较 小 的 数 。 然 后 ， 需 要 递 
减 Spaces 的 值 @。 如 果 不 做 这 些 操作 ， 有 些 线程 将 会 持续 等 待 ， 因 为 spaces 被 日 的 count 初 始 
化 ， 大 于 期 望 值 。 一 组 当中 最 后 一 个 线程 需要 对 计数 器 进行 重 置 ， 并 且 北 增 generation 的 值 
@， 就 像 在 wait() 里 面 做 的 那样 。 最 重要 的 区 别 : 最 后 一 个 线程 不 需要 等 待 。 当 最 后 一 个 线程 
结束 ， 整 个 等 待 也 就 随 之 结束 ! 


现在 就 准备 开始 写 部 分 和 的 第 二 个 实现 吧 。 在 每 一 步 中 ， 每 一 个 线程 都 在 栅栏 出 调用 wait() ， 
来 保证 线程 所 处 步骤 一 致 ， 并 且 当 所 有 线程 都 结束 ， 那 么 最 后 一 个 线程 会 调用 done_waiting() 
来 减少 count 的 值 。 如 果 使 用 两 个 缓存 对 原始 数据 进行 保存 ， 栅 栏 也 可 以 提供 你 所 需要 的 同 

步 。 每 一 步 中 ， 线 程 都 会 从 原始 数据 或 是 缓存 中 读 取 数据 ， 并 且 将 新 值 写 入 对 应 位 置 。 如 果 


有 线程 先 从 原始 数据 处 获取 数据 ， 那 下 一 步 就 从 缓存 上 获取 数据 (或 相反 )。 这 就 能 保证 在 读 与 
写 都 是 由 独立 线程 完成 ， 并 不 存在 条 件 竞争 。 当 线程 结束 等 待 循环 ， 就 能 保证 正确 的 值 最 终 
被 写 入 到 原始 数据 当中 。 下 面 的 代码 就 是 这 样 的 实现 。 


清单 8.13 通过 两 两 更 新 对 的 方式 实现 partial_sum 


struct barrier 

{ 
std::atomic<unsigned> count; 
std::atomic<unsigned> spaces; 
std::atomic<unsigned> generation; 


barrier(unsigned count_): 
count (count_), Sspaces(count_),generation(0) 


{} 


void wait() 

{ 
unsigned const gen=generation.load(); 
if(!--spaces) 
{ 


spaces=count.load(); 


++generation; 

} 

else 

{ 
while(generation.load()==gen) 
{ 

std::this_thread::yield(); 

} 

} 


void done_waiting() 
{ 
--count; 
if(!--spaces) 
{ 
spaces=count.load(); 
++generation; 


} 
}; 


template<typename Iterator> 
void parallel_partial_sum(Iterator first,Iterator last) 


{ 


typedef typename Iterator::value_type value_type; 


struct process_element // 1 


i 


}; 


void operator()(Iterator first,Iterator last, 


std: :vector<value_type>& buffer, 
unsigned i,barrier& b) 


value_type& ith_element=*(firstti); 
bool update_source=false; 


for(unsigned step=0, stride=1;stride<=i;++step, stride*=2) 
{ 
value_type const& source=(step%2)? // 2 
buffer[i]:ith_element; 


value_type& dest=(step%2)? 
ith_element:buffer[i]; 


value_type const& addend=(step%2)? // 3 
buffer[i-stride]:*(firstt+i-stride); 


dest=sourcetaddend; // 4 
update_source=!(step%2); 
b.wait(); // 5 


} 
if(update_source) // 6 
{ 

ith_element=buffer[i]; 
} 


b.done_waiting(); // 7 


unsigned long const length=std::distance(first,last); 


if (length<=1) 
return, 


std::vector<value_type> buffer(length); 
barrier b(length); 


std::vector<std::thread> threads(length-1); // 8 
join_threads joiner(threads); 


Iterator block_start=first; 
for(unsigned long i=0;i<(length-1);++i) 
if 
threads[i]=std::thread(process_element(),first,last, // 9 
std::ref(buffer),i,std::ref(b)); 
} 
process _element()(first,last,buffer,length-1,b); // 10 


代码 的 整体 结构 应 该 不 用 说 了 。process_element 类 有 函数 调用 操作 可 以 用 来 做 具体 的 工作 
四 ， 就 是 运行 一 组 线程 国 ， 并 将 线程 存储 到 vector 中 图， 同样 还 需要 在 主线 程 中 对 其 进行 调用 
四 。 这 里 与 之 前 最 大 的 区 别 就 是 ， 线 程 的 数量 是 根据 列表 中 的 数据 量 来 定 的 ， 而 非 根 
std::thread::hardware_concurrency 。 如 我 之 前 所 说 ， 除 非 你 使 用 的 是 一 个 大 规模 并 行 的 机 

;因为 这 上 面 的 线程 部 十 分 廉价 (虽然 这 样 的 方式 并 不 是 很 好 ) ， 还 能 为 我 们 展示 了 其 整体 
go 这 个 结构 在 有 较 少 线程 的 时 候 ， 每 一 个 线程 只 能 处 理 源 数据 中 的 部 分 数据 ， 当 没有 足够 
的 线程 支持 该 结构 时 ， 效 率 要 比 传递 算法 低 。 


不 管 怎样 ， 主 要 的 工作 都 是 调用 process_element 的 函数 操作 符 来 完成 的 。 每 一 步 ， 都 会 从 原 
始 数据 或 缓存 中 获取 第 i 个 元 素 @@， 并 且 将 获取 到 的 元 素 加 到 指定 stride 的 元 素 中 去 国 ， 如 果 从 
原始 数据 开始 读 取 的 元 素 ， 加 和 后 的 数 需要 存储 在 缓存 中 图 。 然 后 ， 在 开始 下 一 步 前 ， 会 在 栅 
栏 处 等 待 回 。 当 stride 超 出 了 给 定数 据 的 范围 ， 当 最 终结 果 已 经 存在 缓存 中 时 ， 就 需要 更 新 原 
始 数据 中 的 数据 ， 同 样 这 也 意味 着 本 次 加 和 结束 。 最 后 ， 在 调用 栅栏 中 的 done_waiting() 有 函数 
D o 


注意 这 个 解决 方案 并 不 是 异常 安全 的 。 如 果 某 个 线程 在 process_element 执 行 时 抛 出 一 个 异 
常 ， 其 就 会 终止 整个 应 用 o 这 里 可 以 使 用 一 个 std: :promise 来 存储 异常 > 就 像 在 清单 8.9 中 
parallel_ find 的 实现 ， 或 仅 使 用 一 个 被 互 斥 量 保护 的 std::exception_ptr PPT ° 


总 结 下 这 三 个 例子 。 和 希望 其 能 保证 我 们 了 解 8.1、8.2、8.3 和 8.4 节 中 提 到 的 设计 考量 ， 并 且 证 
明了 这 些 技术 在 昌 实 的 代码 中 ， 需 要 承担 些 什么 责任 。 


8.5 在 实践 中 设计 并 发 代码 


[4] http://threadingbuildingblocks.org/ 
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8.6 本 章 总 结 


本 章 我 们 讨论 了 很 多 东西 。 我 们 从 划分 线程 间 的 工作 开始 (比如 ， 数 据 提 前 划分 或 让 线程 形成 
流水 线 )。 之 后 ， 以 低层 次 视角 来 看 多 线程 下 的 性 能 问题 ， 顺 带 了 解 了 伪 共享 和 数据 通讯 ; 了 
解 访问 数据 的 模式 对 性 能 的 影响 。 再 后 ， 了 解 了 附加 注意 事项 是 如 何 影响 并 发 代码 设计 的 ， 
比如 : 异常 安全 和 可 扩展 性 。 最 后 ， 用 一 些 并 行 算法 实现 来 结束 了 本 章 ， 在 设计 这 些 并 行 算 
法 实现 时 碰 到 的 问题 ， 在 设计 其 他 并 行 代码 的 时 候 也 会 遇 到 。 

本 章 中 ， 关 于 线程 池 的 部 分 被 转移 了 。 线 程 池 ” ”一 个 预先 设 定 的 线程 组 ， 会 将 任务 指定 给 
池 中 的 线程 。 很 多 不 错 的 想法 可 以 用 来 设计 一 个 不 过 的 线程 池 ; 所 以 我 们 将 在 下 一 章 中 来 看 
一 些 有 关 线 程 池 的 问题 ， 以 及 高 级 线程 管理 方式 。 





本 章 主 要 内 容 
e 线程 池 
o 处 理 线程 池 中 任务 的 依赖 关系 
© 池 中 线程 如 何 获 取 任 务 
e 中 断 线程 


之 前 的 章节 中 ， 我 们 通过 创建 std: :thread 对 象 来 对 线程 进行 管理 。 在 一 些 情况 下 ， 这 种 方式 
不 可 行 了 ， 因 为 需要 在 线程 的 整个 生命 周期 中 对 其 进行 管理 ， 并 根据 硬件 来 确定 线程 数量 ， 
等 等 。 理 想 情况 是 将 代码 划分 为 最 小 块 ， 再 并 发 执行 ， 之 后 交 给 处 理 器 和 标准 库 ， 进 行 性 能 
优化 。 

另 一 种 情况 是 ， 当 使 用 多 线程 来 解决 某 个 问题 时 ， 在 某 个 条 件 达 成 的 时 候 ， 可 以 提前 结束 。 
可 能 是 因为 结果 已 经 确定 ， 或 者 因为 产生 错误 ， 亦 或 是 用 户 执行 终止 操作 。 无 论 是 哪 种 原 

， 线程 都 需要 发 送 " 请 停止 "请 求 ， 放 育 任 务 ， 清 理 ， 然 后 尽快 停止 。 

本 章 ， 我 们 将 了 解 一 下 管理 线程 和 任务 的 机 制 ， 从 自动 管理 线程 数量 和 自动 管理 任务 划分 开 


始 。 


9.1 线程 池 


很 多 公司 里 ， 雇 员 通 常会 在 办 公 室 度 过 他 们 的 办 公 时 光 ( 偶 尔 也 会 外 出 访问 客户 或 供应 商 )， 或 
是 参加 贸易 展会 。 虽 然 外 出 可 能 很 有 必要 ， 并 且 可 能 需要 很 多 人 一 起 去 ， 不 过 对 于 一 些 特别 
的 雇员 来 说 ， 一 趟 可 能 就 是 几 个 月 ， 甚 至 是 几 年 。 公 司 要 给 每 个 雇员 都 配 一 辆 车 ， 这 基本 上 
是 不 可 能 的 ， 不 过 公司 可 以 提供 一 些 共用 车 辆 ; 这 样 就 会 有 一 定数 量 车 ， 来 让 所 有 雇员 使 
用 。 当 一 个 员工 要 去 异地 旅游 时 ， 那 么 他 就 可 以 从 共用 车 辆 中 预定 一 辆 ， 并 在 返回 公司 的 时 
候 将 车 交还 。 如 果菜 天 没有 闲置 的 共用 车 辆 ， 雇 员 就 得 不 延 后 其 旅程 了 。 


线程 池 就 是 类 似 的 一 种 方式 ， 在 大 多 数 系统 中 ， 将 每 个 任务 指定 给 某 个 线程 是 不 切实 际 的 ， 
不 过 可 以 利用 现 有 的 并 发 性 ， 进 行 并 发 执行 。 线 程 池 就 提供 了 这 样 的 功能 ， 提 交 到 线程 池 中 
的 任务 将 并 发 执行 ， 提 交 的 任务 将 会 挂 在 任务 队列 上 。 队 列 中 的 每 一 个 任务 都 会 被 池 中 的 工 
作 线 程 所 获取 ， 当 任务 执行 完成 后 ， 再 回 到 线程 池 中 获取 下 一 个 任务 。 


创建 一 个 线程 池 时 ， 会 遇 到 几 个 关键 性 的 设计 问题 ， 比 如 : 可 使 用 的 线程 数量 ， 高 效 的 任务 
分 配方 式 ， 以 及 是 否 需 要 等 待 一 个 任务 完成 。 


在 本 节 ， 我 们 将 看 到 线程 池 是 如 何 解决 这 些 问 题 的 ， 从 最 简单 的 线程 池 开 始 吧 | 


9.1.1 取 简 单 的 线程 池 


作为 最 简单 的 线程 池 ， 其 拥有 固定 数量 的 工作 线程 (通常 工作 线程 数量 

与 std: :thread: :hardware_concurrency() 相同 )。 当 工作 需要 完成 时 ， 可 以 调用 函数 将 任务 挂 
在 任务 队列 中 。 每 个 工作 线程 都 会 从 任务 队列 上 获取 任务 ， 然 后 执行 这 个 任务 ， 执 行 完成 后 
再 回来 获取 新 的 任务 。 在 最 简单 的 线程 池 中 ， 线 程 就 不 需要 等 待 其 他 线程 完成 对 应 任务 了 。 
如 果 需 要 等 待 ， 就 需要 对 同步 进行 管理 。 


下 面 清单 中 的 代码 就 展示 了 一 个 最 简单 的 线程 池 实现 。 


清单 9.1 简单 的 线程 池 


class thread_pool 
{ 
std::atomic_bool done; 
thread_safe_queue<std: :function<void()> > work_queue; // 1 
std::vector<std::thread> threads; // 2 
join_threads joiner; // 3 


void worker_thread( ) 


i 


while(!done) // 4 

{ 
std::function<void()> task; 
if(work_queue.try_pop(task)) // 5 


{ 
task(); // 6 

} 

else 

{ 
std::this_thread::yield(); // 7 

} 

} 
} 
public: 


thread_pool(): 
done(false), joiner(threads) 


unsigned const 
thread_count=std::thread::hardware_concurrency(); // 8 


try 
{ 
for(unsigned i=0;i<thread_count;++i) 
{ 
threads .push_back( 
std::thread(&thread_pool::worker_thread,this)); // 9 
} 
} 
catch(...) 
{ 
done=true; // 10 
throw; 
} 


~thread_pool() 


{ 
done=true; // 11 


template<typename FunctionType> 
void submit(FunctionType f) 
{ 
work_queue.push(std::function<void()>(f)); // 12 
} 
J; 


实现 中 有 一 组 工作 线程 @， 并 且 使 用 了 一 个 线程 安全 队列 ( 见 第 6 章 )@ 来 管理 任务 队列 。 这 种 
情况 下 ， 用 户 不 用 等 待 任 务 ， 并 且 任 务 不 需要 返回 任何 值 ， 所 以 可 以 使 

用 std::function<void()> 对 任务 进行 封装 。Ssubmit() 函 数 会 将 函数 或 可 调用 对 象 包装 成 一 
个 std::function<void()> 实例 ， 并 将 其 推 入 队列 中 人 9 。 


线程 始 于 构造 函数 : 使 用 std::thread::hardware_concurrency() 来 获取 硬件 支持 多 少 个 并 发 线 
程 @@， 这 些 线 程 会 在 worker_thread() 成 员 函 数 中 执行 @。 


当 有 异常 抛 出 时 ， 线 程 启动 就 会 失败 ， 所 以 需要 保证 任何 已 启动 的 线程 都 能 停止 ， 并 且 能 在 
这 种 情况 下 清理 干净 。 当 有 异常 抛 出 时 ， 通 过 使 用 imy-catch 来 设置 done 标 志 @ 四 ， 还 有 

join_threads 类 的 实例 (来 自 于 第 8 章 )@ 用 来 汇聚 所 有 线程 。 当 然 也 需 2 ens 

te SOD > # Hjoin_threads 44 tk A A AZ A AE A SEAT A SR AT Ko TE A AA 9 

很 重要 : done 标 志和 worker_queue 必 须 在 threads 数 组 之 前 声明 ， 而 数据 必须 在 joiner 前 声 

明 。 这 就 能 确保 成 员 能 以 正确 的 顺序 销毁 ; 比如 ， 所 有 线程 都 停止 运行 时 ， 队 列 就 可 以 安全 

的 销毁 了 

worker_thread 骂 数 很 简单 : 从 任务 队列 上 获取 任务 回 ， 以 及 同时 执行 这 些 任 务 @@， 执 行 一 个 

循环 直到 done 标 志 被 设置 四 。 如 果 任 务 队 列 上 没有 任务 ， 函 数 会 调 

用 std::this_thread::yield() 让 线程 休息 @@， 并 且 给 予 其 他 线程 向 任务 队列 上 推送 任务 的 机 

会 。 


一 些 简单 的 情况 ， 这 样 线程 池 就 足以 满足 要 求 ， 特 别 是 任务 没有 返回 值 ， 或 需要 执行 一 些 阻 
塞 操作 的 时 候 。 不 过 ， 在 很 多 情况 下 ， 这 样 简单 的 线程 池 完 全 不 够 用 ， 其 他 情况 使 用 这 样 简 
单 的 线程 池 可 能 会 出 现 问 题 ， 比 如 ; 死 锁 。 同 样 ， 在 简单 例子 中 ， 使 用 std::async 能 提供 更 
好 的 功能 (如 第 8 章 中 的 例子 ) 。 

在 本 章 中 ， 我 们 将 了 解 一 下 更 加 复杂 的 线程 池 实 现 ， 通 过 添加 特性 满足 用 户 需求 ， 或 减少 问 
题 的 发 生 几 率 。 


首先 ， 从 已 经 提交 的 任务 开始 说 起 。 


9.1.2 等 竺 提交 到 线程 池 中 的 任务 


第 8 章 中 的 例子 中 ， 线 程 间 的 任务 划分 完成 后 ， 代 码 会 显 式 生 成 新 线程 ， 主 线程 通常 就 是 等 待 
新 线程 在 返回 调用 之 前 结束 ， 确 保 所 有 任务 都 完成 。 使 用 线程 池 ， 就 需要 等 待 任务 提交 到 线 

程 池 中 ， 而 非 直接 提交 给 单个 线程 。 这 与 基于 std::async 的 方法 (第 8 章 等 待 future 的 例子 ) 类 

似 ， 使 用 清单 9.1 aie 简单 线程 池 ， 使 用 第 4 章 中 提 到 的 工具 : 条 件 变量 和 future。 虽 然 ， 会 增 
加 代码 的 复杂 度 ， ， 要 比 直接 对 任务 进行 等 待 的 方式 好 很 多 。 


通过 增加 线程 池 的 复杂 度 ， 可 以 直接 等 待 任务 完成 。 使 用 submit() 部 数 返回 一 个 对 任务 描述 的 
句柄 ， 用 来 等 待 任务 的 完成 。 任 务 句柄 会 用 条 件 变 量 或 future 进 行 包装 ， 这 样 能 使 用 线程 池 来 
简化 代码 。 


一 种 特殊 的 情况 是 ， 执 行 任务 的 线程 需要 返回 一 个 结果 到 主线 程 上 进行 处 理 。 你 已 经 在 本 书 

tm a a ecumulaie 0 Ye 这 种 情况 下 ， 需 要 用 future 对 
最 终 的 结果 进行 转移 。 2 展示 了 对 简单 线程 池 的 修改 ， 通 过 修改 就 能 等 待 任务 完成 ， 以 
及 在 工作 线程 完成 后 ， 返 回 一 个 结果 到 等 待 线 程 中 去 ， 不 过 std::packaged_task<> 实例 是 不 可 
拷贝 的 ， 仅 是 可 移动 的 ， 所 以 不 能 再 使 用 std: :function<> 来 实现 任务 队列 ， 因 

为 std::function<> 需要 存储 可 复制 构造 的 函数 对 象 。 包 装 一 个 自 定义 函数 ， 用 来 处 理 只 可 移 
动 的 类 型 。 这 就 是 一 个 带 有 函数 操作 符 的 类 型 控 除 类 。 只 需要 处 理 那 些 没有 元 数 和 无 返回 的 

函数 ， 所 以 这 是 一 个 简单 的 庶 函 数 调 用 。 


清单 9.2 可 等 待 任 务 的 线程 池 


Class function_wrapper 
{ 
struct impl_base { 
virtual void call()=0; 
virtual ~impl_base() {} 
J; 


std::unique_ptr<impl_base> impl; 
template<typename F> 
struct impl_type: impl_base 
{ 
F f; 
impl_type(F&& f_): f(std::move(f_)) {} 
void call() { f(); } 
}; 
public: 
template<typename F> 
function wrapper(F&& f): 
impl(new impl_type<F>(std::move(f))) 
{} 


后 


void operator()() { impl->call(); } 


function_wrapper() = default; 


function_wrapper(function_wrapper&& other): 
impl(std: :move(other.imp1) ) 
{} 


function wrapper& operator=(function_wrapper&& other) 
{ 

impl=std: :move(other.imp1); 

return *this; 


function_wrapper(const function_wrapper&)=delete; 
function_wrapper (function_wrapper&)=delete; 
function_wrapper& operator=(const function_wrapper&)=delete; 


class thread_pool 


{ 


thread_safe_queue<function_wrapper> work_queue; // 使 用 


function_wrapper ;而 非 使 用 std: : function 


void worker_thread () 
{ 
while(!done) 
{ 
function_wrapper task; 
if(work_queue.try_pop(task) ) 
{ 
task(); 
} 


else 


{ 
std::this_thread::yield(); 


public: 


template<typename FunctionType> 
std::future<typename std::result_of<FunctionType()>::type> // 


submit(FunctionType f) 


typedef typename std::result_of<FunctionType()>:: type 
result_type; // 2 


std: :packaged_task<result_type()> task(std::move(f)); // 3 
std::future<result_type> res(task.get_future()); // 4 
work_queue.push(std::move(task)); // 5 
return res; // 6 
} 
// 休息 一 下 
J; 


首先 ， 修改 的 是 submit() 函 数 @ 返 回 一 个 std::future<> 保存 任务 的 返回 值 ， 并 且 允 许 调 用 者 
等 待 任务 完全 结束 。 因 为 需要 知道 提供 函数 f 的 返回 类 型 ， 所 以 使 

用 std::result of<> : std: :result_of<FunctionType()>::type 是 FunctionType 类 型 的 引用 实 
例 ( 如 ， 有 ， 并 且 没 有 参数 。 同 样 ， 兄 数 中 可 以 对 result_type typedef@ 使 


用 std::result_of<> ° 


然后 ， 将 f 包 装 入 sta: :packaged_task<result_type()> @ ， 因为 f{ 是 一 个 无 参数 的 函数 或 是 可 调 
用 对 象 ， 能 够 返回 result_ type 类 型 的 实例 。 向 任务 队列 推送 任务 回 和 返回 future@ 前 ， 就 可 以 
从 std::packaged_task<> 中 获取 future@“。 注 意 ， 要 将 任务 推送 到 任务 队列 中 时 ， 只 能 使 

用 std: :move() ? 因为 std: :packaged_task<> 是 不 可 拷贝 的 。 为 了 对 任务 进行 处 理 ， 队列 里 面 
存 的 就 是 function wrapper 对 象 ， 而 非 std::function<void()> 对 象 。 


现在 线程 池 人 允许 等 竺 任务， 并且 返 回 任务 后 的 结果 。 下 面 的 清单 就 展示 了 ， 如 何 让 
parallel_ accumuate 函 数 使 用 线程 池 。 


清单 9.3 parallel accumulate 使 用 一 个 可 等 待 任务 的 线程 池 


template<typename Iterator,typename T> 
T parallel_accumulate(Iterator first,Iterator last,T init) 


i 


unsigned long const length=std::distance(first, last); 


if(!length) 
return init; 


unsigned long const block_size=25; 
unsigned long const num_blocks=(length+block_size- 
1)/block_size; // 1 


std::vector<std::future<T> > futures(num_blocks-1); 
thread_pool pool; 


Iterator block_start=first; 

for(unsigned long i=0;i<(num_blocks-1);++1) 

{ 
Iterator block_end=block_start; 
std: :advance(block_end, block_size); 
futures[i]=pool.submit(accumulate_block<Iterator,T>()); // 


block_start=block_end; 
} 
T last_result=accumulate_block<Iterator,T>() 
(block_start, last); 
T result=init; 
for(unsigned long i=0;i<(num_blocks-1);++i) 
{ 
result+=futures[i].get(); 
} 
result += last_result; 
return result; 


与 清单 8.4 相 比 ， 有 几 个 点 需要 注意 一 下 。 首 先 ， 工 作 量 是 依据 使 用 的 块 数 (num_blocks@)， 
而 不 是 线程 的 数量 。 为 了 利用 线程 池 的 最 大 化 可 扩展 性 ， 需 要 将 工作 块 划分 为 最 小 工作 块 。 
娄 线 程 池 中 线程 不 多 时 ， 每 个 线程 将 会 处 理 多 个 工作 块 ， 不 过 随 着 硬件 可 用 线程 数量 的 增 
长 ， 会 有 越 来 越 多 的 工作 块 并 发 执行 。 


当 你 选择 “因为 能 并 发 执行 ， 最 小 工作 块 值 的 一 试 " 时 ， 就 需要 谨 惯 了。 向 线程 池 提 交 一 个 任务 
有 一 定 的 开销 3 让 工作 线程 执行 这 个 任务 2 并 且 将 返回 值 保存 在 std: :future<> 中 3 对 于 太 小 
的 任务 ， 这 样 的 开销 不 划算 。 如 果 任 务 块 太 小 ， 使 用 线程 池 的 速度 可 能 都 不 及 单线 程 。 


假设 ， 任 务 块 的 大 小 合理 ， 就 不 用 为 这 些 事 而 担心 : 打包 任务 、 获 取 future 或 存储 之 后 要 汇 入 
的 std::thread 对 象 ; 使 用 线程 池 的 时 候 ， 这 些 都 需要 注意 。 之 后 ， 就 是 调用 Submit() 来 提交 
任务 @。 


线程 池 也 需要 注意 异常 安全 。 任 何 异常 都 会 通过 submit() 返 回 给 future， 并 在 获取 future 的 结果 
时 ， 抛 出 异常 。 如 果 函 数 因为 异常 退出 ， 线 程 池 的 析 构 函数 会 丢掉 那些 没有 完成 的 任务 ， 等 
待 线程 池 中 的 工作 线程 完成 工作 。 


在 简单 的 例子 中 ， 这 个 线程 池 工 作 的 还 工 不 错 ， 因 为 这 里 的 任务 都 是 相互 独立 的 。 不 过 ， 当 
任务 队列 中 的 任务 有 依赖 关系 时 ， 这 个 线程 池 就 不 能 胜任 了 。 


9.1.3 等 待 依赖 任务 


快速 排序 算法 为 例 ， 原 理 很 简单 : 数据 与 中 轴 数 据 项 比较 ， 在 中 轴 项 两 侧 分 为 大 于 和 小 于 的 
两 个 序列 ， 然 后 再 对 这 两 组 序列 进行 排序 。 这 两 组 序列 会 递归 排序 ， 最 后 会 整合 成 一 个 全 排 
序 序列 。 要 将 这 个 算法 写成 并 发 模式 ， 需 要 保证 递归 调用 能 够 使 用 硬件 的 并 发 能 力 。 


回 到 第 4 章 ， 第 一 次 接触 这 个 例子 ， 我 们 使 用 std::async 来 执行 每 一 层 的 调用 ， 让 标准 库 来 
选择 ， 是 在 新 线程 上 执行 这 个 任务 ， 还 是 当 对 应 get() 调 用 时 ， 进 行 同步 执行 。 运 行 起 来 很 不 
错 ， 因 为 每 一 个 任务 都 在 其 自己 的 线程 上 执行 ， 或 当 需 要 的 时 候 进行 调用 。 


当 回顾 第 8 章 时 ， 使 用 了 一 个 国定 线程 数量 (根据 硬件 可 用 并 发 线程 数 ) 的 结构 体 。 在 这 样 的 情 
况 下 ， 使 用 了 栈 来 挂 起 要 排序 的 数据 块 。 当 每 个 线程 在 为 一 个 数据 块 排序 前 ， 会 向 数据 栈 上 
添加 一 组 要 排序 的 数据 ， 然 后 对 当前 数据 块 排序 结束 后 ， 接 着 对 另 一 块 进行 排序 。 这 里 ， 等 
待 其 他 线程 完成 排序 ， 可 能 会 造成 死 锁 ， 因 为 这 会 消耗 有 限 的 线程 。 有 一 种 情况 很 可 能 会 出 
现 ， 就 是 所 有 线程 都 在 等 某 一 个 数据 块 被 排序 ， 不 过 没有 线程 在 做 排序 。 通 过 拉 取 栈 上 数据 
块 的 线程 ， 对 数据 块 进行 排序 ， 来 解决 这 个 问题 ; 因为 ， 已 处 理 的 指定 数据 块 ， 就 是 其 他 线 
程 都 在 等 待 排序 的 数据 块 。 


如 果 只 用 简单 的 线程 池 进 行 替 换 ， 例 如 : PARAM std::async 的 线程 池 。 只 有 国定 数量 的 
线程 ， 因 为 线程 池 中 没有 空闲 的 线程 ， 线 程 会 等 待 没有 被 安排 的 任务 。 因 此 ， 需 要 和 第 8 章 中 
类 似 的 解决 方案 : 当 等 待 某 个 数据 块 完 成 时 ， 去 处 理 未 完成 的 数据 块 。 如 果 使 用 线程 池 来 管 
理 任 务 列表 和 相关 线程 一 一 使 用 线程 池 的 主要 原因 就 不 用 再 去 访问 任务 列表 了 。 可 以 对 
线程 池 做 一 些 改 动 ， 自 动 完成 这 些 事 情 。 





简单 的 方法 就 是 在 thread_pool 中 添加 一 个 新 函数 ， 来 执行 任务 队列 上 的 任务 ， 并 对 线程 池 
行 管理 。 高 级 线程 池 的 实现 可 能 会 在 等 待 函 数 中 添加 逻辑 ， 或 等 待 其 他 函数 来 处 理 这 个 任 
务 ， 优 先 的 任务 会 让 其 他 的 任务 进行 等 待 。 下 面 清单 中 的 实现 ， 就 展示 了 一 个 新 
run_pending_task() 函 数 ， 对 于 快速 排序 的 修改 将 会 在 清单 9.5 中 展示 。 


p Be Re 


清单 9.4 run_pending_task() 函 数 实 现 


void thread_pool::run_pending_task() 


{ 


function_wrapper task; 
if (work_queue.try_pop(task)) 


{ 
task(); 
} 
else 
{ 
std::this_thread::yield(); 
} 
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时 候 ， 执 行 任务 ; 要 是 没有 的 话 ， 就 会 让 操作 系统 对 线程 进行 重新 分 配 。 


下 面 快速 排序 算法 的 实现 要 比 清单 8.1 中 版 本 简单 许多 ， 因 为 所 有 线程 管理 逻辑 都 被 移入 到 线 
程 池 。 


清单 9.5 基于 线程 池 的 快速 排序 实现 
template<typename T> 


struct sorter // 1 


{ 
thread_pool pool; // 2 


std::list<T> do_sort(std::list<T>& chunk_data) 


{ 
if(chunk_data.empty() ) 
{ 
return chunk_data; 
} 


std::list<T> result; 
result.splice(result.begin(),chunk_data, chunk_data.begin()); 
T const& partition_val=*result.begin(); 


typename std::list<T>::iterator divide _point= 
std: :partition(chunk_data.begin(),chunk_data.end(), 


[&](T const& val){return 


val<partition_val;}); 


} 
ia 


std::list<T> new_lower_chunk; 

new_lower_chunk.splice(new_lower_chunk.end(), 
chunk_data, chunk_data.begin(), 
divide point); 


std::future<std::list<T> > new_lower= // 3 

pool.submit(std::bind(&sorter::do_sort, this, 

std: :move(new_lower_chunk))); 

std::list<T> new_higher(do_sort(chunk_data) ); 
result.splice(result.end(),new_higher ); 
while(!new_lower.wait_for(std::chrono::seconds(0)) == 

std::future_status: : timeout) 

pool.run_pending _task(); // 4 


result.splice(result.begin(),new_lower.get()); 
return result; 


template<typename T> 


std 
{ 


::list<T> parallel _quick_sort(std::list<T> input) 


if(input.empty()) 


{ 


} 


return input; 


sorter<T> s; 


return s.do_sort(input); 


与 清单 8.1 相 比 ， 这 里 将 实 


仅 对 thread_pool 实 例 进行 包装 @@。 


际 工作 放 在 sorter 类 模板 的 do_sort() 成 员 郊 数 中 执行 8， 即使 例子 中 


线程 和 任务 管理 ， 在 线程 等 待 的 时 候 ， 就 会 少 向 线程 池 中 提交 一 个 任务 国 ， 并 且 执 行 任务 队列 
上 未 完成 的 任务 @。 需 要 显 式 的 管理 线程 和 栈 上 要 排序 的 数据 块 。 当 有 任务 提交 到 线程 池 中 ， 
可 以 使 用 std::bind() 绑 定 this 指 针 到 do_sort() 上 ， 绑 定 是 为 了 让 数据 块 进行 排序 。 这 种 情况 
下 ， 需 要 对 new_ lower_chunk 使 用 std::move() 将 其 传 入 函数 ， 数 据 移 动 要 比 拷贝 的 方式 开销 
少 。 


虽然 ， 使 用 等 待 其 他 任务 的 方式 ， 解 决 了 死 锁 问 题 ， 这 个 线程 池 距 离 理想 的 线程 池 很 远 。 


首先 ， 每 次 对 submit() 的 调用 和 对 run_pending_task() 的 调用 ， 访 问 的 都 是 同一 个 队列 。 在 第 8 
章 中 ， 当 多 线程 去 修改 一 组 数据 ， 就 会 对 性 能 有 所 影响 ， 所 以 需要 解决 这 个 问题 。 


9.1.4 避免 队列 中 的 任务 竞争 


线程 每 次 调用 线程 池 的 submit() 函 数 ， 都 会 推送 一 个 任务 到 工作 队列 中 。 就 像 工 作 线 程 为 了 执 
行 任务 ， 从 任务 队列 中 获取 任务 一 样 。 这 意味 着 随 着 处 理 器 的 增加 ， 在 任务 队列 上 就 会 有 很 
多 的 竞争 ， 这 会 让 性 能 下 降 。 使 用 无 锁 队 列 会 让 任务 没有 明显 的 等 待 ， 但 是 乒 兵 缓存 会 消耗 
大 量 的 时 间 。 


为 了 避免 乒 兵 缓存 ， 每 个 线程 建立 独立 的 任务 队列 。 这 样 ， 每 个 线程 就 会 将 新 任务 放 在 自己 
的 任务 队列 上 ， 并 且 当 线程 上 的 任务 队列 没有 任务 时 ， 去 全 局 的 任务 列表 中 取 任 务 。 下 面 列 
表 中 的 实现 ， 使 用 了 一 个 thread local 变量 ， 来 保证 每 个 线程 都 拥有 自己 的 任务 列表 (如 全 局 列 
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清单 9.6 线程 池 线程 具有 本 地 任务 队列 





class thread_pool 


{ 


thread_safe_queue<function_wrapper> pool_work_queue; 


typedef std::queue<function_wrapper> local_queue_type; // 1 
static thread_local std: :unique_ptr<local_queue_type> 
local_work_queue; // 2 


void worker_thread( ) 


{ 


local_work_queue.reset(new local_queue_type); // 3 
while(!done) 
{ 


run_pending_task(); 


public: 
template<typename FunctionType> 
std::future<typename std::result_of<FunctionType( )>::type> 
submit(FunctionType f) 


typedef typename std::result_of<FunctionType()>:: type 
result_type; 


std: :packaged_task<result_type()> task(f); 
std::future<result_type> res(task.get_future()); 
if(local_work_queue) // 4 


{ 
local_work_queue->push(std: :move(task)); 
} 
else 
{ 
pool_work_queue.push(std::move(task)); // 5 
} 
return res; 


void run_pending_task() 
{ 
function_wrapper task; 
if(local_work_queue && !local_work_queue->empty()) // 6 
{ 
task=std: :move(local_work_queue->front()); 
local_work_queue->pop(); 


task(); 
} 
else if(pool_work_queue.try_pop(task)) // 7 
{ 
task(); 
} 
else 
{ 
std::this_thread::yield(); 
} 


// rest as before 


la 


因为 不 希望 非 线程 池 中 的 线程 也 拥有 一 个 任务 队列 > 使 用 std: :unique_ptr<> 指向 线程 本 地 的 
工作 队列 @ ; 这 个 指针 在 worker thread() 中 进行 初始 化 四 。 std:unique_ptr<> 的 析 构 函数 会 保 
证 在 线程 退出 的 时 候 ， 工 作 队 列 被 销毁 。 


submit() 会 检查 当前 线程 是 否 具有 一 个 工作 队列 @@。 如 果 有 ， 就 是 线程 池 中 的 线程 ， 可 以 将 任 
务 放 入 线程 的 本 地 队列 中 ; 否 者 ， 就 像 之 前 一 样 将 这 个 任务 放 在 线程 池 中 的 全 局 队列 中 国 。 


run_pending task()@ 中 的 检查 和 之 前 类 似 ， 只 是 要 对 是 否 存在 本 地 任务 队列 进行 检查 。 如 果 
存在 ， 就 会 从 队列 中 的 第 一 个 任务 开始 处 理 ; 注意 本 地 任务 队列 可 以 是 一 个 普通 

的 std: :queue<> @， 因 为 这 个 队列 只 能 被 一 个 线程 所 访问 ， 就 不 存在 竞争 。 如 果 本 地 线程 上 
没有 任务 ， 就 会 从 全 局 工作 列表 上 获取 任务 @。 


这 样 就 能 有 效 避 免 竟 争 ， 不 过 当 任务 分 配 不 均 时 ， 造 成 的 结果 就 是 : 某 个 线程 本 地 队列 中 有 
很 多 任务 的 同时 ， 其 他 线程 无 所 事 事 。 例 如 : 举 一 个 快速 排序 的 例子 ， 只 有 一 开始 的 数据 块 
能 在 线程 池上 被 处 理 ， 因 为 剩余 部 分 会 放 在 工作 线程 的 本 地 队列 上 进行 处 理 ， 这 样 的 使 用 方 
式 也 违背 使 用 线程 池 的 初衷 。 


幸好 ， 这 个 问题 是 有 解 : 本 地 工作 队列 和 全 局 工作 队列 上 没有 任务 时 ， 可 从 别 的 线程 队列 中 
窃取 任务 。 


9.1.5 窃取 任务 


为 了 让 没有 任务 的 线程 能 从 其 他 线程 的 任务 队列 中 获取 任务 ， 就 需要 本 地 任务 列表 可 以 进行 
访问 ， 这 样 才 能 让 run_pending_tasks() 窃 取 任务 。 需 要 每 个 线程 在 线程 池 队 列 上 进行 注册 ， 
或 由 线程 池 指 定 一 个 线程 。 同 样 ， 还 需要 保证 数据 队列 中 的 任务 适当 的 被 同步 和 保护 ， 这 样 
队列 的 不 变量 就 不 会 被 破坏 。 


实现 一 个 无 锁 队 列 ， 让 其 拥有 线程 在 其 他 线程 禄 取 任 务 的 时 候 ， 能 够 推送 和 弹出 一 个 任务 是 
可 能 的 ; 不 过 ， 这 个 队列 的 实现 就 超出 了 本 书 的 讨论 范围 。 为 了 证 明 这 种 方法 的 可 行 性 ， 将 
使 用 一 个 互 斥 量 来 保护 队列 中 的 数据 。 我 们 希望 任务 窃取 是 一 个 不 常见 的 现象 ， 这 样 就 会 减 
少 对 互 不 量 的 竞争 ， 并 且 使 得 简单 队列 的 开销 最 小 。 下 面 ， 实 现 了 一 个 简单 的 基于 锁 的 任务 
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清单 9.7 基于 锁 的 任务 窃取 队列 


class work_stealing_queue 
{ 
private: 
typedef function_wrapper data_type; 


std::deque<data_type> the_queue; // 1 
mutable std::mutex the_mutex; 


public: 
work_stealing_queue( ) 


{} 


work_stealing queue(const work_stealing_queue& other )=delete; 
work_stealing queue& operator=( 
const work_stealing queue& other )=delete; 


void push(data_type data) // 2 

{ 
std: :lock_guard<std: :mutex> lock(the_mutex); 
the_queue.push_front(std: :move(data) ); 


bool empty() const 

{ 
std: :lock_guard<std: :mutex> lock(the_mutex) ; 
return the_queue.empty(); 


bool try_pop(data_type& res) // 3 

{ 
std: :lock_guard<std: :mutex> lock(the_mutex) ; 
if(the_queue.empty() ) 
{ 


return false; 


res=std: :move(the_queue.front()); 
the_queue.pop_front(); 
return true; 


bool try_steal(data_type& res) // 4 

{ 
std::lock_guard<std: :mutex> lock(the_mutex) ; 
if(the_queue.empty() ) 


return false; 


res=std: :move(the_queue.back()); 
the_queue.pop_back(); 
return true; 
} 
J; 


这 个 队列 对 std: :deque<fuction_wrapper> 进行 了 简单 的 包装 四 ， 就 能 通过 一 个 互 矿 锁 来 对 所 有 
访问 进行 控制 了 。push()@ 和 try_pop()@@ 对 队列 的 前 端 进行 操作 ，try_steal()@ 对 队列 的 后 端 
进行 操作 。 


这 就 说 明 每 个 线程 中 的 “队列 ?是 一 个 后 进 先 出 的 栈 ， 最 新 推 入 的 任务 将 会 第 一 个 执行 。 从 缓存 
角度 来 看 ， 这 将 对 性 能 有 所 提升 ， 因 为 任务 相关 的 数据 一 直 存 于 缓存 中 ， 要 比 提前 将 任务 相 
关 数 据 推送 到 栈 上 好 。 同 样 ， 这 种 方式 很 好 的 映射 到 某 个 算法 上 ， 例 如 : 快速 排序 。 之 前 的 
实现 中 ， 每 次 调用 do_sort() 都 会 推送 一 个 任务 到 栈 上 ， 并 且 等 待 这 个 任务 执行 完毕 。 通 过 对 
最 新 推 入 任务 的 处 理 ， 就 可 以 保证 在 将 当前 所 需 数据 块 处 理 完 成 前 ， 其 他 任务 是 否 需 要 这 些 
数据 块 ， 从 而 可 以 减少 活动 任务 的 数量 和 栈 的 使 用 次 数 。try_steal() 从 队列 末尾 获取 任务 ， 为 
了 减少 与 try_pop() 之 间 的 竞争 ; 使 用 在 第 6、7 章 中 的 所 讨论 的 技术 来 让 try_pop() 和 try_steal() 
并 发 执行 。 

OK， 现 在 拥有 了 一 个 很 不 错 的 任务 队列 ， 并 且 支 持 穷 取 ; 那 这 个 队列 将 如 何在 线程 池 中 使 用 
呢 ? 这 里 简单 的 展示 一 下 。 


清单 9.8 使 用 任务 窃取 的 线程 池 


class thread_pool 


{ 
typedef function_wrapper task_type; 


std::atomic_bool done; 
thread_safe_queue<task_type> pool_work_queue; 


std::vector<std: :unique_ptr<work_stealing_queue> > queues; // 


std::vector<std::thread> threads; 
join_threads joiner; 


static thread_local work_stealing_queue* local_work_queue; // 


static thread_local unsigned my_index; 


void worker_thread(unsigned my_index_) 

{ 
my_index=my_index_j; 
local_work_queue=queues[my_index].get(); // 3 
while(!done) 
{ 


run_pending_task(); 


bool pop_task_from_local_queue(task_type& task) 
{ 


return local_work_queue && local_work_queue->try_pop(task); 





bool pop_task_from_pool_queue(task_type& task) 
{ 


return pool_work_queue.try_pop(task); 





bool pop_task_from_other_thread_queue(task_type& task) // 4 
{ 
for(unsigned 1i1=0;i<queues.size();++i) 
{ 
unsigned const index=(my_index+i+1)%queues.size(); // 5 
if (queues[index]->try_steal(task)) 
{ 


return true; 





} 


return false; 


public: 
thread_pool(): 
done(false), joiner(threads) 


unsigned const 


thread_count=std::thread: :hardware_concurrency(); 


try 
{ 
for(unsigned i=0;i<thread_count;++i) 
{ 
queues. push_back(std: :unique_ptr<work_stealing_queue>( 
// 6 
new work_stealing_ queue) ); 
threads .push_back( 
std::thread(&thread_pool: :worker_thread, this,i)); 
} 
} 
catch(...) 
{ 
done=true; 
throw; 
} 
} 
~thread_pool() 
{ 
done=true; 
} 


template<typename FunctionType> 
std::future<typename std::result_of<FunctionType()>: :type> 
submit ( 
FunctionType f) 


typedef typename std::result_of<FunctionType()>:: type 
result_type; 
std: :packaged_task<result_type()> task(f); 
std::future<result_type> res(task.get_future()); 
if (local_work_queue) 
{ 
local_work_queue->push(std: :move(task)); 
} 


else 


{ 


pool_work_queue.push(std: :move(task)); 











} 
return res; 
} 
void run_pending_task() 
{ 
task_type task; 
if(pop_task_from_local_queue(task) || // 7 
pop_task_from_pool_queue(task) || // 8 
pop_task_from_other_thread_queue(task)) // 9 
{ 
task(); 
} 
else 
{ 
std::this_thread::yield(); 
} 
} 


HF 


这 段 代码 与 清单 9.6 很 相似 。 第 一 个 不 同 在 于 ， 每 个 线程 都 有 一 个 work_stealing_queue， 而 非 
只 是 普通 的 std::queue<> @。 妆 每 个 线程 被 创建 ， 就 创建 了 一 个 属于 自己 的 工作 队列 @@， 每 
个 线程 自己 的 工作 队列 将 存储 在 线程 池 的 全 局 工作 队列 中 四 。 列 表 中 队列 的 序号 ， 会 传递 给 线 
程 函 数 ， 然 后 使 用 序号 来 索引 对 应 队列 @@。 这 就 意味 着 线程 池 可 以 访问 任意 线程 中 的 队列 ， 为 
了 给 闲置 线程 入 取 任务 。run_pending _task() 将 会 从 线程 的 任务 队列 中 取出 一 个 任务 来 执行 
@， 或 从 线程 池 队 列 中 获取 一 个 任务 @@， 亦 或 从 其 他 线程 的 队列 中 获取 一 个 任务 @。 


pop_task_ from_other thread_queue()@ 会 遍历 池 中 所 有 线程 的 任务 队列 ， 然 后 党 试 窃取 任 
务 。 为 了 避 een 试 从 列表 中 的 第 一 个 线程 上 窃取 任务 ， 每 一 个 线程 都 会 从 下 一 个 
线程 开始 饥 历 ， 自身 的 线程 序号 来 确定 开始 遍历 的 线程 序号 o 


使 用 线程 池 有 很 多 好 处 ， 还 有 很 多 很 多 的 方式 能 为 某 些 特殊 用 法 提升 性 能 ， 不 过 这 就 留 给 读 
者 作为 作业 吧 。 


特别 是 还 没有 探究 动态 变换 大 小 的 线程 池 ， 即 使 线程 被 阻塞 的 时 候 (例如 : |/O 或 互 斥 锁 )， 
序 都 能 保证 CPU 最 优 的 使 用 率 。 





下 面 ， 我 们 将 来 了 解 一 下 线程 管理 的 “高 级 "用 法 中 断 线程 。 


9.1 线程 池 


344 


9.2 F RF 


很 多 情况 下 ， 使 用 信号 来 终止 一 个 长 时 间 运 行 的 线程 是 合理 的 。 这 种 线程 的 存在 ， 可 能 是 因 
为 工作 线程 所 在 的 线程 池 被 销 锚 ， 或 是 用 户 显 式 的 取消 了 这 个 任务 ， 亦 或 其 他 各 种 原因 。 不 
管 是 什么 原因 ， 原 理 都 一 样 : 需要 使 用 信号 来 让 未 结束 线程 停止 运行 。 这 里 需要 一 种 合适 的 
方式 让 线程 主动 的 停 下 来 ， 而 非 让 线程 夏 然 而 止 。 


你 可 能 会 给 每 种 情况 制定 一 个 独立 的 机 制 ， 这 样 做 的 意义 不 大 。 不 仅 因 为 用 统一 的 机 制 会 更 
容易 在 之 后 的 场景 中 实现 ， 而 且 写 出 来 的 中 断代 码 不 用 担心 在 哪里 使 用 。C++11 标 准 没 有 提供 
这 样 的 机 制 ， 不 过 实现 这 样 的 机 制 也 并 不 困难 。 


在 了 解 一 下 应 该 如 何 实现 这 种 机 制 前 ， 先 来 了 解 一 下 启动 和 中 断 线程 的 接口 。 


9.2.1 尼 动 和 中 断 线程 


先 看 一 下 外 部 接口 ， 需 要 从 可 中 断 线程 上 获取 些 什么 ?最 起 码 需 要 和 std::thread 相同 的 接 
口 ， 还 要 多 加 一 个 interrupt() 函 数 : 


class interruptible_thread 

{ 

public: 
template<typename FunctionType> 
interruptible_thread(FunctionType f); 
void join(); 
void detach(); 
bool joinable() const; 
void interrupt(); 


}; 


类 内 部 可 以 使 用 std::thread 来 管理 线程 ， 并 且 使 用 一 些 自 定义 数据 结构 来 处 理 中 断 。 现 在 ， 
从 线程 的 角度 能 看 到 什么 呢 ?“ 能 用 这 个 类 来 中 断 线程 "一 一 需要 一 个 断 点 (interruption point)。 
在 不 添加 多 余 的 数据 的 前 提 下 ， 为 了 使 断 点 能 够 正常 使 用 ， 就 需要 使 用 一 个 没有 参数 的 函 

数 : interruption_point()。 这 意味 着 中 断 数 据 结构 可 以 访问 thread _ local 变量， 并 在 线程 运行 
时 ， 对 变量 进行 设置 ， 因 此 当 线 程 调用 interruption_point() 驾 数 时 ， 就 会 去 检查 当前 运行 线程 
的 数据 结构 。 我 们 将 在 后 面 看 到 interruption_point() 的 具体 实现 。 


thread _ local 标志 是 不 能 使 用 普通 的 std: :thread 管理 线程 的 主要 原因 ; 需要 使 用 一 种 方法 分 
配 出 一 个 可 访问 的 interruptible_ thread 实例 ， 就 像 新 启动 一 个 线程 一 样 。 在 使 用 已 提供 函数 来 
做 这 件 事 情 前 ， 需 要 将 interruptible_ thread 实例 传递 给 std::thread 的 构造 函数 ， 创 建 一 个 能 
够 执行 的 线程 ， 就 像 下 面 的 代码 清单 所 实现 。 


清单 9.9 interruptible _ thread 的 基本 实现 


class interrupt_flag 
{ 
public: 
void set(); 
bool is_set() const; 
J; 
thread_local interrupt_flag this_thread_interrupt_flag; // 1 


class interruptible_thread 
{ 
std::thread internal_thread; 
interrupt_flag* flag; 
public: 
template<typename FunctionType> 
interruptible_thread(FunctionType f) 
{ 
std: :promise<interrupt_flag*> p; // 2 
internal_thread=std::thread([f,&p]{ // 3 
p.set_value(&this_thread_interrupt_flag); 
F(); // 4 
}); 
flag=p.get_future().get(); // 5 
} 
void interrupt() 
{ 
if (flag) 
{ 
flag->set(); // 6 


hey 


提供 函数 f 是 包装 了 一 个 lambda 函 数 四 ， 线 程 将 会 持 有 f 副 本 和 本 地 promise 变 量 (p) 的 引用 @。 
在 新 线程 中 ，lambda 函 数 设 置 promise 变 量 的 值 到 this_thread interrupt flag( 在 thread local@ 
中 声明 ) 的 地 址 中 ， 为 的 是 让 线程 能 够 调用 提供 函数 的 副本 外。 调用 线程 会 等 待 与 其 future 相 关 
的 promise 就 绪 ， 并 且 将 结果 存 入 到 flag 成 员 变 量 中 国 。 注 意 ， 即 使 ambda 亏 数 在 新 线程 上 执 
行 ， 对 本 地 变量 p 进 行 巧 空 引 用 ， 都 没有 问题 ， 因 为 在 新 线程 返回 之 前 ，interruptible_thread 
构造 函数 会 等 待 变量 p， 直 到 变量 p 不 被 引用 。 实 现 没 有 考虑 处 理 汇 入 线程 ， 或 分 离线 程 。 所 
以 ， 需 要 flag 变 量 在 线程 退出 或 分 离 前 已 经 声明 ， 这 样 就 能 避免 悬空 问题 。 


interrupt() 函 数 相 对 简单 : 需要 一 个 线程 去 做 中 断 时 ， 需 要 一 个 合法 指针 作为 一 个 中 断 标志 ， 
所 以 可 以 仅 对 标志 进行 设置 @。 


9.2.2 检查 线程 是 否 中 断 


现在 就 可 以 设置 中 断 标志 了 ， 不 过 不 检查 线程 是 否 被 中 断 ， 这 样 的 意义 就 不 大 了 。 使 用 
interruption_point() 函 数 最 简单 的 情况 ; 可 以 在 一 个 安全 的 地 方 调用 这 个 函数 ， 如 果 标 志 已 经 
设置 ， 就 可 以 抛 出 一 个 thread_interrupted 弄 常 : 


void interruption_point() 


{ 
if(this_thread_interrupt_flag.is_set()) 


£ 


throw thread_interrupted(); 


代码 中 可 以 在 适当 的 地 方 使 用 这 个 函数: 


void foo() 
{ 
while(!done) 
{ 
interruption_point(); 
process_next_item(); 


虽然 也 能 工作 ， 但 不 理想 。 最 好 实在 线程 等 待 或 阻塞 的 时 候 中 断 线程 ， 因 为 这 时 的 线程 不 能 
运行 ， 也 就 不 能 调用 interruption_point() 函 数 | 在 线程 等 待 的 时 候 ， 什 么 方式 才能 去 中 断 线程 
呢 ? 


9.2.3 中 断 等 待 条 件 变 量 


OK， 需 要 仔细 选择 中 断 的 位 置 ， 并 通过 显 式 调用 interruption_point() 进 行 中 断 ， 不 过 在 线程 阻 
塞 等 待 的 时 候 ， 这 种 办 法 就 显得 苍白 无 力 了 ， 例 如 : 等 待 条 件 变量 的 通知 。 就 需要 一 个 新 函 
数 一 interruptible_wait() 一 一 就 可 以 运行 各 种 需要 等 待 的 任务 ， 并 且 可 以 知道 如 何 中 断 等 
待 。 之 前 提 到 ， 可 能 会 等 待 一 个 条 件 变 量 ， 所 以 就 从 它 开 始 : 如 何 做 才能 中 断 一 个 等 待 的 条 
件 变 量 呢 ? 最 简单 的 方式 是 ， 当 设置 中 断 标志 时 ， 需 要 提醒 条 件 变 量 ， 并 在 等 待 后 立即 设置 
断 点 。 为 了 让 其 工作 ， 需 要 提醒 所 有 等 待 对 应 条 件 变量 的 线程 ， 就 能 确保 感谢 兴趣 的 线程 能 
够 苏醒 。 伪 苏醒 是 无 论 如 何 都 要 处 理 的 ， 所 以 其 他 线程 ( 非 感 兴趣 线程 ) 将 会 被 当 作 伪 苏 醒 处 理 
一 一 两 者 之 间 没 什么 区 别 。interrupt_flag 结 构 需要 存储 一 个 指针 指向 一 个 条 件 变量 ， 所 以 用 
set() 函 数 对 其 进行 提醒 。 为 条 件 变 量 实现 的 interruptible wait() 可 能 会 看 起 来 像 下 面 清单 中 所 
me 








清单 9.10 A std::condition_ variable 实现 的 interruptible_wait 有 问题 版 


void interruptible wait(std::condition_variable& cv, 

std: :unique_lock<std::mutex>& 1k) 

{ 
interruption_point(); 
this_thread_interrupt_flag.set_condition_variable(cv); // 1 
cv.wait(lk); // 2 
this_thread_interrupt_flag.clear_condition_variable(); // 3 
interruption_point(); 


假设 函数 能 够 设置 和 清除 相关 条 件 变 量 上 的 中 断 标 志 ， 代 码 会 检查 中 断 ， 通 过 interrupt_flag 为 
当前 线程 关联 系 件 变量 @@， 等 待 条 件 变量 @， 清 理 相关 条 件 变量 国 ， 并 且 再 次 检查 中 断 。 如 果 
线程 在 等 待 期 间 被 条 件 变量 所 中 断 ， 中 断 线程 将 广播 条 件 变 量 ， 并 唤醒 等 待 该 条 件 变 量 的 线 
程 ， 所 以 这 里 就 可 以 检查 中 断 。 不 幸 的 是 ， 代 码 有 两 个 问题 。 第 一 个 问题 比较 明显 ， 如 果 想 
要 线程 安全 : std: :condition_variable: :wait() 可 以 抛 出 异常 ， 所 以 这 里 会 直接 退出 7 而 没有 
通过 条 件 变 量 删 除 相 关 的 中 断 标 志 。 这 个 问题 很 容易 修复 ， 就 是 在 析 构 苑 数 中 添加 相关 删除 
操作 即 可 。 


第 二 个 问题 就 不 大 明显 了 ， 这 段 代码 存在 条 件 竞 争 。 虽 然 ， 线 程 可 以 通过 调用 
interruption_point() 被 中 断 ， 不 过 在 调用 wait() 后 ， 条 件 变 量 和 相关 中 断 标 志 就 没有 什么 系 了 ， 
因为 线程 不 是 等 待 状态 ， 所 以 不 能 通过 条 件 变量 的 方式 唤醒 。 就 需要 确保 线程 不 会 在 最 后 一 
次 中 断 检查 和 调用 wait() 间 被 唤醒 。 这 里 ， 不 对 std::condition_variable 的 内 部 结构 进行 研 
究 ; 不过， 可 通过 一 种 方法 来 解决 这 个 问题 : 使 用 lk 上 的 互 不 量 对 线程 进行 保护 ， 这 就 需要 将 
k 传 递 到 set_condition_variable() 驾 数 中 去 。 不 幸 的 是 ， 这 将 产生 两 个 新 问题 : 需要 传递 一 个 
互 斥 量 的 引用 到 一 个 不 知道 生命 周期 的 线程 中 去 (这 个 线程 做 中 断 操作 ) 为 该 线程 上 锁 (调用 


interrupt() 的 时 候 )。 这 里 可 能 会 死 锁 ， 并 且 可 能 访问 到 一 个 已 经 销毁 的 互 不 量 ， 所 以 这 种 方法 
a es 没有 interruptible_wait() 情 况 下 也 可 以 时 (可 

能 有 些 严格 )， 那 有 没有 其 他 选择 呢 ? 一 个 选择 就 是 放置 超时 等 待 ， 使 用 wait for() 并 带 有 一 个 
简单 的 超时 量 (比如 ，1ms)。 在 线程 被 中 断 前 ， 算 是 给 了 线程 一 个 等 待 的 上 限 ( 以 时 钟 刻度 为 基 
准 )。 如 果 这 样 做 了 ， 等 待 线程 将 会 看 到 更 多 因为 超时 而 “ 伪 ? 苏 醒 的 线程 ， 不 过 超时 也 不 轻易 
的 就 帮助 到 我 们 。 与 interrupt flag 相 关 的 实现 的 一 个 实现 放 在 下 面 的 清单 中 展示 。 





清单 9.11 为 std::condition_variable 在 interruptible_ wait 中 使 用 超时 
class interrupt_flag 


std::atomic<bool> flag; 
std::condition_variable* thread_cond; 
std::mutex set_clear_mutex; 


public: 
interrupt_flag(): 
thread_cond(0) 
{} 


void set() 

{ 
flag.store(true, std: :memory_order_relaxed); 
std: :lock_guard<std: :mutex> 1k(set_clear_mutex); 
if(thread_cond) 


{ 
thread_cond->notify_all(); 

} 
} 
bool is_set() const 
{ 

return flag.load(std::memory_order_relaxed); 
} 


void set_condition_variable(std::condition_variable& cv) 
{ 
std::lock_guard<std::mutex> 1k(set_clear_mutex); 
thread_cond=&cv; 


void clear_condition_variable() 


{ 
std::lock_guard<std: :mutex> 1k(set_clear_mutex); 
thread_cond=0; 

} 

struct clear_cv_on_destruct 

{ 
~clear_cv_on_destruct() 
{ 

this_thread_interrupt_flag.clear_condition_variable(); 

} 

}; 

}; 


void interruptible wait(std::condition_variable& cv, 
std::unique_lock<std::mutex>& 1k) 


interruption_point(); 
this_thread_interrupt_flag.set_condition_variable(cv); 
interrupt_flag::clear_cv_on_destruct guard; 
interruption_point(); 

cv.wait_for(1lk,std::chrono: :milliseconds(1)); 
interruption_point(); 


如 果 有 谓词 (相关 函数 ) 进 行 等 待 ，1ms 的 超时 将 会 完全 在 谓词 循环 中 完全 隐藏 : 


template<typename Predicate> 

void interruptible wait(std::condition_variable& cv, 
std: :unique_lock<std: :mutex>& 1k, 
Predicate pred) 


interruption_point(); 
this_thread_interrupt_flag.set_condition_variable(cv); 
interrupt_flag::clear_cv_on_destruct guard; 
while(!this_thread_interrupt_flag.is_set() && !pred()) 
{ 


cv.wait_for(1lk,std::chrono::milliseconds(1)); 


} 


interruption_point(); 


这 会 让 谓词 被 检查 的 次 数 增加 许多 ， 不 过 对 于 简单 调用 wait() 这 套 实 现 还 是 很 好 用 的 。 超 时 变 
ERR JEM : 通过 制定 时 间 ， 比 如 : 1ms 或 更 短 。OK， 对 于 std::condition_variable 的 等 
待 ， 就 需要 小 心 应 对 了 ; std::condition variable _any 呢 ? 还 是 能 做 的 更 好 吗 ? 


9.2.4 使 用 std::condition variable any 中 断 等 待 


std::condition_variable_any 与 std::condition_variable 的 不 同 在 

于 ， std: :condition_variable_any 可 以 使 用 任意 类 型 的 锁 ， 而 不 仅 

有 std: :unique_lock<std::mutex> ° 可 以 让 事情 做 起 来 更 加 简单 ， 并 

且 std: :condition_variable_any 可 以 比 std::condition_variable 做 的 更 好 。 因为 能 与 任意 类 
型 的 锁 一 起 工作 ， 就 可 以 设计 自己 的 锁 ， 上 锁 /解锁 interrupt flag 的 内 部 互 斥 量 
set_clear_mutex， 并 且 锁 也 支持 等 待 调用 ， 就 像 下 面 的 代码 。 


清单 9.12 为 std::condition_variable_any 设计 的 interruptible_ wait 


class interrupt_flag 

{ 
std::atomic<bool> flag; 
std::condition_variable* thread_cond; 
std::condition_variable_any* thread_cond_any; 
std::mutex set_clear_mutex; 


public: 
interrupt_flag(): 


thread_cond(0), thread_cond_any(0) 
{} 


void set() 
{ 
flag.store(true, std: :memory_order_relaxed); 
std::lock_guard<std: :mutex> 1k(set_clear_mutex); 
if(thread_cond) 
{ 
thread_cond->notify_all(); 
} 


else if(thread_cond_any) 


{ 
thread_cond_any->notify_all(); 


template<typename Lockable> 
void wait(std::condition_variable_any& cv,Lockable& 1k) 
{ 
struct custom_lock 
{ 
interrupt_flag* self; 
Lockable& 1k; 


custom_lock(interrupt_flag* self_, 
std::condition variable anyé& cond, 
Lockable& 1k_): 
self(self_),1lk(lk_ ) 


self->set_clear_mutex.lock(); // 1 
self->thread_cond_any=&cond; // 2 


void unlock() // 3 


{ 
1k.unlock(); 


self->set_clear_mutex.unlock(); 


void lock() 


{ 
std::lock(self->set_clear_mutex,1lk); // 4 


~custom_lock() 
{ 
self->thread_cond_any=0; // 5 
self->set_clear_mutex.unlock(); 
} 
J; 
custom_lock cl(this,cv,1k); 
interruption_point(); 
cv.wait(cl); 
interruption_point(); 
} 


// rest as before 


Hy 


template<typename Lockable> 
void interruptible wait(std::condition_variable_any& cv, 
Lockable& 1k) 


this_thread_interrupt_flag.wait(cv, 1k); 


自 定义 的 锁 类 型 在 构造 的 时 候 ， 需 要 所 锁 住 内 部 set_clear_ mutex@， 对 thread_cond_any 指 
针 进 行 设置 ， 并 引 用 std: :condition_variable_any 传 入 锁 的 构造 函数 中 @。Lockable 引 用 将 会 
在 之 后 进行 存储 ， 其 变量 必须 被 锁 住 。 现 在 可 以 安心 的 检查 中 断 ， 不 用 担心 竞争 了 。 如 果 这 
时 中 断 标志 已 经 设置 ， 那 么 标志 一 定 是 在 锁 住 set_clear_mutex 时 设置 的 。 当 条 件 变量 调用 自 
定义 锁 的 unlock() 函 数 中 的 wait() 时 ， 就 会 对 Lockable 对 象 和 set_clear_mutex 进 行 解锁 国 。 这 
就 允许 线程 可 以 尝试 中 断 其 他 线程 获取 set_clear_mutex 锁 ; 以 及 在 内 部 wait() 调 用 之 后 ， 检 查 
thread_cond_any 指 针 。 这 就 是 在 替换 std::condition_variable 后 ， 所 拥有 的 功能 (不 包括 管 
理 )。 当 wait() 结 束 等 待 (因为 等 待 ， 或 因为 伪 苏 醒 )， 因 为 线程 将 会 调用 |lock() 骂 数 ， 这 里 依旧 要 
求 锁 住 内 部 set_clear_mutex， 并 且 锁 住 Lockable 对 象 @。 现 在 ， 在 wait() 调 用 时 ， 
custom_lock 的 析 构 函数 中 国清 理 thread_cond_any 指 针 ( 同 样 会 解锁 set_clear_mutex) 之 前 ， 
可 以 再 次 对 中 断 进行 检查 。 


9.2.5 中 断 其 他 阻塞 调用 


这 次 轮 到 ae 量 的 等 待 了 ， 不 过 其 他 阻塞 情况 ， 比 如 : 互 斥 锁 ， ES 该 
DK ?通常 情况 下 ， 可 以 使 用 std::condition_variable 的 超时 选项 ， 因 为 在 实际 运 
能 很 ae 件 变量 的 等 待 终止 (不 访问 内 部 互 斥 量 或 future 的 话 )。 不 过 ， 在 某 些 情况 下 ， 
尔 知道 知道 你 在 等 待 什么 ， 这 样 就 可 以 让 循环 在 interruptible_ wait() 函 数 中 运行 。 作 为 一 个 例 
， 这 里 为 std::future<> 重 载 了 interruptible_wait() 的 实现 : 


Peay 


template<typename T> 
void interruptible _wait(std::future<T>& uf) 


{ 

while(!this_thread_interrupt_flag.is_set()) 

{ 

if(uf.wait_for(1k,std::chrono::milliseconds(1)== 
std::future_status: :ready) 
break; 

} 

interruption_point(); 
} 


等 待 会 在 中 断 标 志 设 置 好 的 时 候 ， 或 future 准 备 就 绪 的 时 候 停止 ， 不 过 实现 中 每 次 等 待 future 
的 时 间 只 有 1ms。 这 就 意味 着 ， 中 断 请 求 被 确定 前 ， 平 均等 待 的 时 间 为 0.5ms( 这 里 假设 存在 
一 个 高 精度 的 时 钟 )。 通 常 wait for 至少 会 等 待 一 个 时 钟 周 期 ， 所 以 如 果 时 钟 周 期 为 15ms， 那 
么 结束 等 待 的 时 间 将 会 是 15ms， 而 不 是 1ms。 接 受 与 不 接受 这 种 情况 ， 都 得 视 情 况 而 定 。 如 
果 这 必要 ， 且 时 钟 支持 的 话 ， 可 以 持续 削减 超时 时 间 。 这 种 方式 将 会 让 线程 苏醒 很 多 次 ， 来 
检查 标志 ， 并 且 增 加 线程 切换 的 开销 。 


OK ， 我 们 已 经 了 解 如 何 使 用 interruption_point() 和 interruptible_wait() 函 数 检查 中 断 。 


当中 断 被 检查 出 来 了 ， 要 如 何 处 理 它 呢 ? 


9.2.6 处 理 中 断 


从 中 断 线程 的 角度 看 ， 中 断 就 是 thread _interrupted 异 常 ， 因 此 能 像 处 理 其 他 异常 那样 进行 处 
$B 。 


特别 是 使 用 标准 catch 块 对 其 进行 捕获 : 


try 
{ 
do_something(); 
} 
catch(thread_interrupted&) 


{ 


handle_interruption(); 


捕获 中 断 ， 进 行 处 理 。 其 他 线程 再 次 调用 interrupt() 时 ， 线 程 将 会 再 次 被 中 断 ， 这 就 被 称 为 断 
点 (interruption point)。 如 果 线 程 执行 的 是 一 系列 独立 的 任务 ， 就 会 需要 断 点 ; 中 断 一 个 任 
务 ， 就 意味 着 这 个 任务 被 丢弃 ， 并 且 该 线程 就 会 执行 任务 列表 中 的 其 他 任务 。 


因为 thread interrupted 是 一 个 异常 ， 在 能 够 被 中 断 的 代码 中 ， 之 前 线程 安全 的 注意 事项 都 是 
适用 的 ， 就 是 为 了 确保 资源 不 会 泄露 ， 并 在 数据 结构 中 留 下 对 应 的 退出 状态 。 通 常 ， 让 线程 
中 断 是 可 行 的 所 以 只 需要 让 异常 传播 即 可 。 不 过 ， 当 异 常 传 入 std: :thread 的 析 构 函数 

时 ， std: :terminate() 将 会 调用 ， 并 且 整 个 程序 将 会 终止 。 为 了 避免 这 种 情况 3 需要 在 每 个 
将 interruptible _ thread 变量 作为 参数 传 入 的 函数 中 放置 catch(thread interrupted) 处 理 块 ， 可 以 
将 catch 块 包装 进 interrupt flag 的 初始 化 过 程 中 。 因 为 异常 将 会 终止 独立 进程 ， 就 能 保证 未 处 
理 的 中 断 是 异常 安全 的 。interruptible _ thread 构造 函数 中 对 线程 的 初始 化 ， 实 现 如 下 : 


internal_thread=std::thread([f,&p]{ 
p.set_value(&this_thread_interrupt_flag); 


try 
{ 
f(); 
} 
catch(thread_interrupted const&) 
{} 
}); 


下 面 ， 我 们 来 看 个 更 加 复杂 的 例子 。 


9.2.7 应 用 退出 时 中 断后 全 任务 


试想 ， 在 桌面 上 查找 一 个 应 用 。 这 就 需要 与 用 户 互动 ， 应 用 的 状态 需要 能 在 显示 器 上 显示 ， 
就 能 看 出 应 用 有 什么 改变 。 为 了 避免 影响 GUI 的 响应 时 间 ， 通 常会 将 处 理 线程 放 在 后 台 运 行 。 
后 台 进 程 需要 一 直 执 行 ， 直 到 应 用 退出 ; 后 台 线 程 会 作为 应 用 启动 的 一 部 分 被 启动 ， 并 且 在 


应 用 终止 的 时 候 停止 运行 。 通 常 这 样 的 应 用 只 有 在 机 器 关闭 时 ， 才 会 退出 ， 因 为 应 用 需要 更 
新 应 用 最 新 的 状态 就 需要 全 时 间 运 行 o 在 某 些 情况 下 2 当 应 用 被 关闭 2 需要 使 用 有 序 的 方 
式 将 后 台 线 程 关 闭 ， 其 中 一 种 方式 就 是 中 断 。 


下 面 清单 中 为 一 个 系统 实现 了 简单 的 线程 管理 部 分 。 


清单 9.13 在 后 台 监 视 文件 系统 


std::mutex config_mutex; 
std: :vector<interruptible_thread> background_threads; 


void background_thread(int disk_id) 


{ 
while(true) 
x 
interruption_point(); // 1 
fs_change fsc=get_fs_changes(disk_id); // 2 
if(fsc.has_changes() ) 
{ 
update_index(fsc); // 3 
} 
} 
} 


void start background_processing() 
{ 
background_threads.push_back( 
interruptible_thread(background_ thread, disk_1)); 
background_threads.push_back( 
interruptible_ thread(background_thread, disk_2)); 


int main() 
{ 
start_background_processing(); // 4 
process gui_until_exit(); // 5 
std: :unique_lock<std::mutex> 1k(config_mutex) ; 
for(unsigned i1=0;i<background_threads.size();++1) 
{ 
background_threads[i].interrupt(); // 6 
} 


for(unsigned i=0;i<background_threads.size();++i) 


{ 
background_threads[i].join(); // 7 


启动 时 ， 后 台 线 程 就 已 经 启动 四 。 之 后 ， 对 应 线程 将 会 处 理 GUI@。 当 用 户 要 求 进程 退出 时 ， 
后台 进程 将 会 被 中 断 回 ， 并 且 主 线程 会 等 待 每 一 个 后 台 线 程 结束 后 才 退 出 加 。 后 台 线 程 运行 在 
一 个 循环 中 ， 并 时 刻 检查 磁盘 的 变化 @， 对 其 序号 进行 更 新 国 。 调 用 interruption_point() 
数 ， 可 以 在 循环 中 对 中 断 进行 检查 。 


为 什么 中 断 线程 前 ， 对 线程 进行 等 待 ?为 什么 不 中 断 每 个 线程 ， 让 它们 执行 下 一 个 任务 ? 答 
案 就 是 “并 发 "。 线 程 被 中 断后 ， 不 会 马上 结束 ， 因 为 需要 对 下 一 个 断 点 进行 处 理 ， 并 且 在 退出 
前 执行 析 构 函数 和 代码 异常 处 理 部 分 。 因 为 需要 汇聚 每 个 线程 ， 所 以 就 会 让 中 断 线程 等 待 ， 
即使 线程 还 在 做 着 有 用 的 工作 -中断 其 他 线程 。 只 有 当 没 有 工作 时 (所 有 线程 都 被 中 断 )， 不 
需要 等 待 。 这 就 允许 中 断 线程 并 行 的 处 理 自己 的 中 断 ， 并 更 快 的 完成 中 断 。 


中 断 机 制 很 容易 扩展 到 更 深层 次 的 中 断 调用 ， 或 在 特定 的 代码 块 中 禁用 中 断 ， 这 就 当做 留 给 
读者 的 作业 吧 。 


9.3 本 章 总 结 


在 木 章 中 ， 我 们 了 解 各 种 “高 级 "线程 管理 技术 : 线程 池 和 中 断 线程 。 也 了 解 了 如 何 使 用 本 地 任 
务 队列 ， 使 用 任务 窃取 的 方式 减 小 同步 开销 ， 提 高 线程 池 的 吞吐 量 ; 等 待 子 任务 完成 的 同时 
执行 队列 中 其 他 任务 ， 从 而 来 避免 死 锁 。 


也 了 解 了 使 用 线程 去 中 断 另 一 个 处 理 线程 的 各 种 方式 ， 比 如 : 使 用 特定 的 断 点 和 函数 执行 中 
断 ， 要 不 就 是 使 用 某 种 方法 ， 对 阻塞 等 待 进行 中 断 。 


第 10 划 多 线程 程序 的 测试 和 调试 


本 章 主 要 内 容 

o 并 发 相关 的 错误 

o 定位 错误 和 代码 审查 

© 设计 多 线程 测试 用 例 

© 多 线程 代码 的 性 能 

目前 为 止 ， 我 们 了 解 如 何 写 并 发 代码 一 一 可 以 使 用 哪些 工具 ， 这 些 工具 应 该 如 何 使 用 。 不 
过 ， 在 软件 开发 中 重要 的 一 部 分 我 们 还 没有 提 及 : 测试 与 调试 。 如 果 你 希望 阅读 完 本 章 后 就 
能 很 轻松 的 去 调试 并 发 代码 ， 本 章 无 法 满足 你 的 预期 。 

测试 和 调试 并 发 代码 比较 麻烦 。 除 了 对 一 些 重要 问题 的 思考 ， 我 也 会 展示 一 些 技巧 让 测试 和 
调试 变 得 简单 一 些 。 





测试 和 调试 就 像 一 个 硬币 的 两 面 一 一 测试 是 为 了 找到 代码 中 可 能 存在 的 错误 ， 需 要 调试 来 修 
复 错 误 ° 如 果 在 开发 阶段 发 现 了 某 个 BTR > 而 非 发 布 后 发 现 》 这 将 会 将 使 错误 的 破坏 力 降低 
好 几 个 数量 级 。 


了 解 测试 和 调试 前 ， 需 要 了 解 并 发 代码 可 能 会 出 现 的 问题 。 


10.1 与 并 发 相关 的 错误 类 型 


你 可 以 在 并 发 代码 中 发 现 各 式 各 样 的 错误 ， 这 些 错误 不 会 集中 个 方面 。 不 过 ， 有 一 些 错 
误 与 使 用 并 发 直接 相关 ， 本 章 重 点 关注 这 些 错误 。 通 常 ， iene 常 有 两 大 类 : 


。 不 必要 阻塞 
© 条 件 竞争 
这 两 大 类 的 颗粒 度 很 大 ， 让 我 们 将 其 分 成 颗粒 度 较 小 的 问题 。 


10.1.1 ALR 


“不 必要 阻塞 "是 什么 意思 ? 一 个 线程 被 阻塞 的 时 候 ， 不 能 处 理 任何 任务 ， 因 为 它 在 等 待 其 

他 “条 件 " 的 达成 。 通 常 这 些 “条 件 " 就 是 一 个 互 太 量 、 一 个 条 件 变量 或 一 个 future， 也 可 能 是 一 个 
MO 操作 。 这 是 多 线程 代码 的 先天 特性 ， 不 过 这 也 不 是 在 任何 时 候 都 可 取 的 一 衍生 成 “不 必要 
阻塞 "。 你 会 问 : 为 什么 不 需要 阻塞 ? 通常 ， 是 因为 其 他 线程 在 等 待 该 阻塞 线程 上 的 某 些 操作 
完成 ， 如 果 该 线程 阻塞 了 ， 那 那些 线程 必然 会 被 阻塞 。 





这 个 主题 可 以 分 成 以 下 几 个 问题 : 


o 死 锁 如 你 在 第 3 章 所 见 ， 在 死 锁 的 情况 下 ， 两 个 线程 会 互相 等 待 。 当 线程 产生 死 锁 ， 
应 该 完成 的 任务 就 会 持续 搁置 。 举 个 例子 来 说 ， 一 些 线程 是 负责 对 用 户 界面 操作 的 线 
程 ， 在 死 锁 的 情况 下 ， 用 户 界面 就 会 无 响应 。 在 另 一 些 例子 中 ， 界 面 接口 会 保持 响应 ， 
不 过 有 些 任 务 就 无 法 完成 ， 比 如 : 查询 无 结果 返回 ， 或 文档 未 打印 。 








。 活 锁 与 死 锁 的 情况 类 似 。 不 同 的 地 方 在 于 线程 不 是 阻塞 等 待 ， 而 是 在 循环 中 持续 检 
查 ， 例 如 : 自 旋 锁 。 一 些 比较 严重 的 情况 下 ， 其 表现 和 死 锁 一 样 (应 用 不 会 做 任何 处 理 ， 
停止 响应 )，CPU 的 使 用 率 还 居 高 不 下 ; 因为 线程 还 在 循环 中 被 检查 ， 而 不 是 阻塞 等 待 。 
在 一 些 不 太 严重 的 情况 下 ， 因 为 使 用 随机 调度 ， 活 锁 的 问题 还 是 可 以 解决 的 。 


I/O 阻 塞 或 外 部 输入 一 一 当 线程 被 外 部 输入 所 阻塞 ， 线 程 也 就 不 能 做 其 他 事情 了 (即使 ， 等 
待 输入 的 情况 永远 不 会 发 生 )。 因此 ， 被 外 部 输入 所 阻塞 ， 就 会 让 人 不 太 高 兴 ， 因 为 可 能 
有 其 他 线程 正在 等 待 这 个 线程 完成 某 些 任务 


简单 的 介绍 了 一 下 “不 必要 阻塞 "的 组 成 。 


那么 ， 条 件 竞争 呢 ? 


10.1.2 条 件 竞争 


条 件 竞争 在 多 线程 代码 中 很 常见 一 一 很 多 条 件 竞争 表现 为 死 锁 与 活 锁 。 而 且 ， 并 非 所 有 条 件 
竞争 都 是 恶性 的 对 独立 线程 相关 操作 的 调度 ， 决 定 了 条 件 竞 争 发 生 的 时 间 。 很 多 条 件 竞 
争 是 良性 的 ， 比 如 : 哪 一 个 线程 去 处 理 任 务 队 列 中 的 下 一 个 任务 。 不 过 ， 很 多 并 发 错误 的 引 
起 也 是 因为 条 件 竞 争 。 





特别 是 ， 条 件 竞 争 经 常会 产生 以 下 几 种 类 型 的 错误 : 


© 数据 竞争 因为 未 同步 访问 一 块 共享 内 存 ， 将 会 导致 代码 产生 未 定义 行为 。 在 第 5 章 已 
经 介绍 了 数据 竞争 ， 也 了 解 了 c++ 的 内 存 模型 。 数 据 竞 争 通常 发 生 在 错误 的 使 用 原子 操 
作 ， 做 同步 线程 的 时 候 ， 或 没 使 用 互 斥 量 所 保护 的 共享 数据 的 时 候 。 





© 破坏 不 变量 一 “主要 表现 为 悬空 指针 (因为 其 他 线程 已 经 将 要 访问 的 数据 删除 了 )， 随 机 存 
储 错 误 (因为 局 部 更 新 ， 导 致 线程 读 取 了 不 一 样 的 数据 )， 以 及 双重 释放 (比如 : 当 两 个 线 
程 对 同一 个 队列 同时 执行 pop 操 作 ， 想 要 删除 同一 个 关联 数据 )， 等 等 。 不 变量 被 破坏 可 
以 看 作为 “基于 数据 "的 问题 。 当 独立 线程 需要 以 一 定 顺序 执行 某 些 操作 时 ， 错 误 的 同步 会 
导致 条 件 竞争 ， 比 如 : 顺序 被 破坏 。 


。 生命 周期 问题 一 一 虽然 这 类 问题 也 能 归结 为 破坏 了 不 变量 ， 不 过 这 里 将 其 作为 一 个 单独 
的 类 别 给 出 。 这 里 的 问题 是 ， 线 程 会 访问 不 存在 的 数据 ， 这 可 能 是 因为 数据 被 删除 或 销 
角 了 ， 或 者 转移 到 其 他 对 象 中 去 了 。 生 命 周期 问题 ， 通 常 是 在 一 个 线程 引用 了 局 部 变 
量 ， 在 线程 还 没有 完成 前 ， 局 部 变量 的 “死期 "就 已 经 到 了 ， 不 过 这 个 问题 并 不 止 存在 这 种 
情况 下 。 当 你 手动 调用 join() 等 待 线程 完成 工作 ， 你 需要 保证 异常 抛 出 的 时 候 ，join() 还 会 
等 待 其 他 未 完成 工作 的 线程 。 这 是 线程 中 基本 异常 安全 的 应 用 。 





秋 性 条 件 竞争 就 如 同一 个 杀手 。 死 锁 和 活 锁 会 表现 为 : 应 用 挂 起 和 反应 迟钝 ， 或 超 长 时 间 完 
成 任务 。 当 一 个 线程 产生 死 锁 或 活 锁 ， 可 以 用 调试 器 附着 到 该 线程 上 进行 调试 。 条 件 竞 争 ， 

破坏 不 变量 ， 以 及 生命 周期 间 题 ， 其 表现 都 是 代码 可 见 的 (比如 ， 随 机 崩溃 或 错误 输出 ) 一 可 
能 重 写 了 系统 部 分 的 内 存 使 用 方式 (不 会 改 太 多 )。 其 中 ， 可 能 是 因为 执行 时 间 ， 导 致 问题 无 法 
定位 到 具体 的 位 置 。 这 是 共享 内 存 系统 的 诅咒 需要 通过 线程 尝试 限制 可 访问 的 数据 ， 并 

且 还 要 正确 的 使 用 同步 ， 应 用 中 的 任何 线程 都 可 以 复写 (可 被 其 他 线程 访问 的 ) 数 据 。 


现在 已 经 了 解 了 这 两 大 类 中 都 有 哪些 具体 问题 了 。 


下 面 就 让 我 们 来 了 解 ， 如 何在 你 的 代码 中 定位 和 修复 这 些 问题 。 


10.2 定位 并 发 错误 的 技术 


之 前 的 章节 ， 我 们 了 解 了 与 并 发 相关 的 错误 类 型 ， 以 及 如 何在 代码 中 体现 出 来 的 。 这 些 信 息 
可 以 帮助 我 们 来 判断 ， 的 代码 中 是 否 存在 有 隐藏 的 错误 。 


最 简单 直接 的 就 是 直接 看 代码 。 虽 然 看 起 来 比较 明显 ， 但 是 要 彻底 的 修复 问题 ， 却 是 很 难 

的 。 读 刚 写 完 的 代码 ， 要 比 读 已 经 存在 的 代码 容易 的 多 。 同 理 ， 当 在 审查 别人 写 好 的 代码 

时 ， 给 出 一 个 通读 双 ane Slain de ne 
易 见 的 问题 。 为 什么 要 花 时 间 来 仔细 梳理 代码 ? 想 想 之 前 提 到 的 并 发 相关 的 
ee 阅 代 码 
的 时 候 ， 考 虑 一 些 具 体 的 事情 ， 并且 发 现 问题 。 





即使 已 经 很 对 代码 进行 了 很 详细 的 审阅 ， 依 昌 会 错过 一 些 bug， 这 就 需要 确定 一 下 代码 是 否 做 
ee PS 一 些 代码 审阅 的 技巧 。 


10.2.1 代码 审阅 发 现 潜在 的 错 1i 


在 审阅 多 线程 代码 时 ， 重 点 要 检查 与 并 发 相关 的 错误 。 如 果 可 能 ， 可 以 让 同事 /同伴 来 审阅 。 
因为 不 是 他 们 写 的 代码 ， 他 们 将 会 考虑 这 段 代码 是 怎么 工作 的 ， 就 可 能 会 覆盖 到 一 些 你 没有 
想到 的 情况 ， 从 而 找 出 一 些 潜在 的 错误 。 审 阅 人 员 需 要 有 了 时间 去 做 审阅 并 非 在 休闲 时 间 
简单 的 扫 一 眼 。 大 多 数 并 发 问题 需要 的 不 仅仅 是 一 次 快速 浏览 通常 需要 在 找到 问题 上 花 
费 很 多 时 间 。 











如 果 你 让 你 的 同时 来 审阅 代码 ， 他 /她 肯定 对 你 的 代码 不 是 很 熟悉 。 因 此 ， 他 /她 会 从 不 同 的 角 
度 来 看 你 的 代码 ， 然 后 指出 你 没有 注意 的 事情 。 如 果 你 的 同事 都 没有 空 ， 你 可 以 叫 你 的 朋 
友 ， 或 传 到 网 络 上 ， 让 网 友 审 阅 (注意 ， 别 传 一 些 机 密 代码 上 去 )。 实 在 没有 人 审阅 你 的 代码 ， 
不 要 着 急 一 一 你 还 可 以 做 很 多 事情 。 对 于 初学 者 ， 可 以 将 代码 放置 一 段 时 间 KE BE FA 
的 另外 的 部 分 ， 或 是 阅读 一 本 书籍 ， 亦 或 出 去 渔 达 汐 达 。 在 休息 之 后 ， 当 再 集中 注意 力 做 某 
此 事情 (潜意识 会 考虑 很 多 问题 )。 同 样 ， 当 你 做 完 其 他 事情 ， 回 头 再 看 这 段 代码 ， 就 会 有 些 隔 
生 一 一 你 可 能 会 从 另 一 个 角度 来 看 你 自己 以 前 写 的 代码 。 





另 一 种 方式 就 是 自己 审阅 。 可 以 向 别人 详细 的 介绍 你 所 写 的 功能 ， 可 能 并 不 是 一 个 监 正 的 人 
可 能 要 对 一 只 玩具 能 或 一 只 橡皮 鸡 来 进行 解释 ， 并 且 我 个 人 觉得 写 一 些 比 较 详细 的 注释 
是 非常 有 益 的 。 在 解释 过 程 中 ， 会 考虑 每 一 行 过 后 ， 会 发 生 什 么 事情 ， 有 哪些 数据 被 访问 
了 ， 问 自己 关于 代码 的 问题 ， 并 且 向 自己 解释 这 些 问 题 。 我 觉得 这 是 种 非常 有 效 的 技 
辣 自 答 ， 对 每 个 问题 认真 考虑 ， 这 些 问题 往往 都 会 揭示 一 些 问 题 ， 也 会 有 益 于 
a 








审阅 多 线程 代码 需要 考虑 的 问题 


审阅 代码 的 时 候 考 虑 和 代码 相关 的 问题 ， 以 及 有 利于 找 出 代码 中 的 问题 。 问 题 审阅 者 需要 在 
代码 中 找到 相应 的 回答 或 错误 。 我 认为 下 面 这 些 问题 必须 要 问 (当然 ， 不 是 一 个 综合 性 的 列 
表 )， 你 也 可 以 找 一 些 其 他 问题 来 帮助 你 找到 代码 的 问题 。 


这 里 ， 列 一 下 我 的 清单 : 
e 并 发 访问 时 ， 那 些 数据 需要 保护 ? 
© 如 何 确定 访问 数据 受到 了 保护 ? 
e 是 否 会 有 多 个 线程 同时 访问 这 段 代 码 ? 
© 这 个 线程 获取 了 哪个 互 斥 量 ? 
© 其 他 线程 可 能 获取 哪些 互 斥 量 ? 


两 个 线程 间 的 操作 是 否 有 依赖 关系 ?如何 满足 这 种 关系 ? 


© 这 个 线程 加 载 的 数据 还 是 合法 数据 吗 ? 数据 是 否 被 其 他 线程 修改 过 


当 假设 其 他 线程 可 以 对 数据 进行 修改 ， 这 将 意味 着 什么 了 并且， 怎么 确保 这 样 的 事情 不 
会 发 生 ? 


最 后 一 个 问题 ， 我 最 喜欢 ， 因 为 它 让 我 着 实 的 去 考虑 线程 之 问 的 关系 。 通 过 假设 一 个 bug 和 一 
行 代码 相关 联 ， 你 就 可 以 扮演 侦探 来 追踪 bug 出 现 的 原因 。 为 了 让 你 自己 确定 代码 里 面 没有 

bug， 需 要 考虑 代码 运行 的 各 种 情况 。 在 数据 被 多 个 互 斥 量 所 保护 的 时 候 ， 这 种 方式 尤其 有 

用 ， 比 如 : 使 用 线程 安全 队列 (第 6 章 )， 可 以 对 队 头 和 队 尾 使 用 独立 的 互 斥 量 :就 是 为 了 确保 在 
持 有 一 个 互 斥 量 的 时 候 ， 访 问 是 安全 的 ， 这 里 必须 确保 持 有 其 他 互 斥 量 的 线程 不 能 同时 访问 

同一 元 素 。 还 需要 特别 关注 的 是 ， 对 公共 数据 的 显 式 处 理 ， 使 用 一 个 指针 或 引用 的 方式 让 其 
他 代码 来 获取 数据 。 


倒数 第 二 个 问题 也 很 重要 ， 因 为 这 是 很 容易 产生 错误 的 地 方 : 先 释 放 再 获取 一 个 互 斤 量 的 前 
提 是 ， 其 他 线程 可 能 会 修改 共享 数据 。 虽 然 很 明显 ， 但 当 互 斥 锁 不 是 立即 可 见 可 能 因为 
是 内 部 对 象 一 一 就 会 不 知 不 觉 的 掉 入 陷阱 中 。 在 第 6 章 ， 已 经 了 解 到 这 种 情况 是 怎么 引起 条 件 
竞争 ， 以 及 如 何 给 细 粒 度 线程 安全 数据 结构 带 来 麻烦 。 不 过 ， 非 线程 安全 栈 将 top() 和 pop() 操 
作 分 开 是 有 意义 的 ， 当 多 线程 会 并 发 的 访问 这 个 栈 ， 问 题 会 马上 出 现 ， 因 为 在 两 个 操作 的 调 
用 间 ， 内 部 互 矿 锁 已 经 被 释放 ， 并 且 另 一 个 线程 对 栈 进 行 了 人 和 修改。 解决 方 案 就 是 将 两 个 操作 
合并 ， 就 能 用 同一 个 锁 来 对 操作 的 执行 进行 保护 ， 就 消除 了 条 件 竞争 的 问题 。 








OK， 你 已 经 审阅 过 代码 了 (或 者 让 别人 看 过 )。 现 在 ， 你 确信 代码 没有 问题 。 
就 像 需 要 用 味觉 来 证 明 ， 你 现在 吃 的 东西 一 一 怎么 测试 才能 确认 你 的 代码 没有 bug 呢 ? 


10.2.2 通过 测试 定位 并 发 相关 的 错误 


写 单线 程 应 用 时 ， 如 果 时 间 充 足 ， 测 试 起 来 相对 简单 。 原 则 上 ， 设 置 各 种 可 能 的 输入 (或 设置 
成 感 兴趣 的 情况 )， 然 后 执行 应 用 。 如 果 应 用 行为 和 输出 正确 ， 就 能 判断 其 能 对 给 定 输入 集 给 
出 正确 的 答案 。 检 查 错 误 状态 (比如 : 处 理 磁盘 满载 错误 ) 就 会 比 处 理 可 输入 测试 复杂 的 多 ， 不 
过 原理 是 一 样 的 设置 初始 条 件 ， 然 后 让 程序 执行 。 





测试 多 线程 代码 的 难度 就 要 比 单线 程 大 好 几 个 数量 级 ， 因 为 不 确定 是 线程 的 调度 情况 。 因 
此 ， 即 使 使 用 测试 单线 程 的 输入 数据 ， 如 果 有 条 件 变 量 潜藏 在 代码 中 ， 那 么 代码 的 结果 可 能 
会 时 对 时 错 。 只 是 因为 条 件 变量 可 能 会 在 有 些 时 候 ， 等 待 其 他 事情 ， 从 而 导致 结果 错误 或 正 
确 。 


因为 与 并 发 相关 的 bug 相 当 难 判断 ， 所 以 在 设计 并 发 代码 时 需要 格外 说 愤 。 设 计 的 时 候 ， 每 自 
代码 痢 需 要 进行 测试 ， 以 保证 没有 问题 ， 这 样 才能 在 测试 出 现 问题 的 时 候 ， 别 除 并 发 相关 的 
bug 一 一 例如 ， 对 队列 的 push 和 pop， 分 别 进行 并 发 的 测试 ， 就 要 好 于 直接 使 用 队列 测试 其 中 
Se a dre ed 考虑 什么 样 的 代码 是 可 以 用 来 测试 正在 设计 
的 这 个 结构 实 章 节 | 与 设计 测试 代码 相关 的 内 容 。 











测试 的 目的 就 是 为 了 消除 与 并 发 相关 的 问题 。 如 果 在 单线 程 测试 的 时 候 ， 遇 到 了 问题 ， 那 这 
个 问题 就 是 普通 的 bug， 而 非 并 发 相关 的 bug。 当 问题 发 生 在 未 测试 区 域 (in the wild)， 也 就 是 
没有 在 测试 范围 之 内 ， 像 这 样 的 情况 就 要 特别 注意 。bug 出 现在 应 用 的 多 线程 部 分 ， 并 不 意味 
着 该 问题 是 一 个 多 线程 相关 的 bug。 使 用 线程 池 管 理 某 一 级 并 发 的 时 候 ， 通 常会 有 一 个 可 配置 
的 参数 ， 用 来 指定 工作 线程 的 数量 。 当 手动 管理 线程 时 ， 就 需要 将 代码 改 成 单线 程 的 方式 进 
行 测试 。 不 管 哪 种 方式 ， 将 多 线程 简化 为 单线 程 后 ， 就 能 将 与 多 线程 相关 的 bug 排 除 掉 。 反 过 
来 说 ， 当 问题 在 单 芯 系 统 中 消失 (即使 还 是 以 多 线程 方式 )， 不 过 问题 在 多 芯 系 统 或 多 核 系统 中 
出 现 ， 就 能 确定 你 被 多 线程 相关 的 bug 坑 了 ， 可 能 是 条 件 变量 的 问题 ， 还 有 可 能 是 同步 或 内 存 
序 的 问题 。 


测试 并 发 的 代码 很 多 ， 不 过 通过 测试 的 代码 结构 就 没 那么 多 了 ; 对 结构 的 测试 也 很 重要 ， 就 
像 对 环境 的 测试 一 样 。 


如 果 你 依旧 将 测试 并 发 队列 当做 一 个 测试 例 ， 你 就 需要 考虑 这 些 情况 
o 使 用 单线 程 调用 push() 或 pop()， 来 确定 在 一 般 情 况 下 队列 是 否 工作 正常 
o 其 他 线程 调用 pop() 时 ， 使 用 另 一 线程 在 空 队 列 上 调用 push() 
e 在 空 队列 上 ， 以 多 线程 的 方式 调用 push() 
© 在 满载 队列 上 ， 以 多 线程 的 方式 调用 push() 
。 在 空 队列 上 ， 以 多 线程 的 方式 调用 pop() 
。 在 满载 队列 上 ， 以 多 线程 的 方式 调用 pop() 
。 在 非 满载 队列 上 (任务 数量 小 于 线程 数量 )， 以 多 线程 的 方式 调用 pop() 


© 当 一 线程 在 空 队 列 上 调用 pop() 的 同时 ， 以 多 线程 的 方式 调用 push() 


。 当 一 线程 在 满载 队列 上 调用 pop() 的 同时 ， 以 多 线程 的 方式 调用 push() 
© 当 多 线程 在 空 队 列 上 调用 pop() 的 同时 ， 以 多 线程 方式 调用 push() 
© 当 多 线程 在 满载 队列 上 调用 pop() 的 同时 ， 以 多 线程 方式 调用 push() 

这 是 我 所 能 想到 的 场景 ， 可 能 还 有 更 多 ， 之 后 你 需要 考虑 测试 环境 的 因素 : 
e。 “多 线程 "是 有 多 少 个 线程 (3 个 ，4 个 ， 还 是 1024 个 ?) 
© 系统 中 是 否 有 足够 的 处 理 器 ， 能 让 每 个 线程 运行 在 属于 自己 的 处 理 器 上 
e 测试 需要 运行 在 哪 种 处 理 器 架构 上 
o 在 测试 中 如 何 对 “同时 "进行 合理 的 安排 


这 些 因素 的 考虑 会 具体 到 一 些 特殊 情况 。 四 个 因素 都 需要 考虑 ， 第 一 个 和 最 后 一 个 会 影响 测 
试 结构 本 身 (在 10.2.5 节 中 会 介绍 )， 另 外 两 个 就 和 实际 的 物理 测试 环境 相关 了 。 使 用 线程 数量 
相关 的 测试 代码 需要 独立 测试 ， 可 通过 很 多 结构 化 测试 获得 最 合适 的 调度 方式 。 在 了 解 这 些 
技巧 前 ， 先 来 了 解 一 下 如 何 让 你 的 应 用 更 容易 测试 。 


10.2.3 可 测试 性 设计 


测试 多 线程 代码 很 困难 ， 所 以 你 需要 将 其 变 得 简单 一 些 。 很 重要 的 一 件 事 就 是 ， 在 设计 代码 
时 ， 考 虑 其 的 可 测试 性 。 可 测试 的 单线 程 代码 设 计 已 经 说 烂 了 ， 而 且 其 中 许多 建议 ， 在 现在 
依旧 适用 。 通 常 ， 如 果 代码 满足 一 下 几 点 ， 就 很 容易 进行 测试 : 

e 每 个 函数 和 类 的 关系 都 很 清楚 。 

© 部 数 短 小 精 悍 。 

© 测试 用 例 可 以 完全 控制 被 测试 代码 周边 的 环境 。 

。 执行 特定 操作 的 代码 应 该 集中 测试 ， 而 非 分 布 式 测试 。 

。 需要 在 完成 编写 后 ， 考 虑 如 何 进行 测试 。 

以 上 这 些 在 多 线程 代码 中 依旧 和 适用。 实际 上 ， 我 会 认为 对 多 线程 代码 的 可 测试 性 要 比 单 线程 
的 更 为 重要 ， 因 为 多 线程 的 情况 更 加 复杂 。 最 后 一 个 因素 尤为 重要 : 即使 不 在 写 完 代码 后 ， 
去 写 测试 用 例 ， 这 也 是 一 个 很 好 的 建议 ， 能 让 你 在 写 代 码 之 前 ， 想 想 应 该 怎么 去 测试 它 一 一 
用 什么 作为 输入 ， 什 么 情况 看 起 来 会 让 结果 变 得 糟糕 ， 以 及 如 何 激发 代码 中 潜在 的 问题 ， 等 


AE 


FO 


并 发 代码 测试 的 一 种 最 好 的 方式 : 去 并 发 化 测试 。 如 果 代码 在 线程 间 的 通讯 路 径 上 出 现 问 ， 
就 可 以 让 一 个 已 通讯 的 单线 程 进行 执行 ， 这 样 会 减 小 问题 的 难度 。 在 对 数据 进行 访问 的 应 用 
进行 测试 时 ， 可 以 使 用 单线 程 的 方式 进行 。 这 样 线程 通讯 和 对 特定 数据 块 进行 访问 时 只 有 一 
个 线程 ， 就 达到 了 更 容易 测试 的 目的 。 


例如 ， 当 应 用 设计 为 一 个 多 线程 状态 机 时 ， 可 以 将 其 分 为 若干 块 。 将 每 个 逻辑 状态 分 开 ， 就 
能 保证 对 于 每 个 可 能 的 输入 事件 、 转 换 或 其 他 操作 的 结果 是 正确 的 ; 这 就 是 使 用 了 单线 程 测 
试 的 技巧 ， 测 试用 例 提供 的 输入 事件 将 来 自 于 其 他 线程 。 之 后 ， 核 心 状态 机 和 消息 路 由 的 代 
码 ， 就 能 保证 时 间 能 以 正确 的 顺序 ， 正 确 的 传递 给 可 单独 测试 的 线程 上 ， 不 过 对 于 多 并 发 线 
程 ， 需 要 为 测试 专门 设计 简单 的 逻辑 状态 。 


或 者 ， 如 果 将 代码 分 割 成 多 个 块 (比如 : 读 共享 数据 /变换 数据 /更 新 共享 数据 )， 就 能 使 用 单线 
程 来 测试 变换 数据 的 部 分 。 麻 烦 的 多 线程 测试 问题 ， 转 换 成 单线 程 测试 读 和 更 新 共享 数据 ， 
就 会 简单 许多 。 


一 件 事 需要 小 心 ， 就 是 茶 些 库 会 用 其 内 部 变量 存储 状态 ， 当 多 线程 使 用 同一 库 中 的 函数 ， 这 
个 状态 就 会 被 共享 。 这 的 确 是 一 个 问题 ， 并 且 这 个 问题 不 会 马上 出 现在 访问 共享 数据 的 代码 
中 。 不 过 ， 随 着 你 对 这 个 库 的 熟悉 ， 就 会 清楚 这 样 的 情况 会 在 什么 时 候 出 现 。 之 后 ， 可 以 适 
当 的 加 一 些 保 护 和 同步 ， 或 使 用 B 计 划 让 多 线程 安全 并 发 访问 的 功能 。 





将 并 发 代码 设计 的 有 更 好 的 测试 性 ， 要 比 以 代码 分 块 的 方式 处 理 并 发 相关 的 问题 好 很 多 。 当 
然 ， 还 要 注意 对 非 线程 安全 库 的 调用 。10.2.1 节 中 那些 问题 ， 也 需要 在 审阅 自己 代码 的 时 候 格 
外 注意 。 虽 然 ， 这 些 问题 和 测试 (可 测试 性 ) 没 有 直接 的 关系 ， 但 带 上 "测试 由 子 "时 候 ， 就 要 者 
虑 这 些 问 题 了 ， 并 且 还 要 考虑 如 何 测试 已 写 好 的 代码 ， 这 就 会 影响 设计 方向 的 选择 ， 也 会 让 
测试 做 的 更 加 容易 一 些 。 


na hare Gt ink Scan a a 
容器 或 事件 逻辑 状态 机 ) 以 "单线 程 "的 形式 (可 能 还 通过 并 发 块 和 其 他 线程 进行 互动 ) 进 行 测试 。 


下 面 就 让 我 们 了 解 一 下 测试 多 线程 代码 的 技术 。 


10.2.4 多 线程 测试 技术 


想 通 过 一 些 技巧 写 一 些 较 短 的 代码 ， 来 对 函数 进行 测试 ， 比 如 : 如 何 处 理 调度 序列 上 的 bug ? 
这 里 的 确 有 几 个 方法 能 进行 测试 ， 让 我 们 从 变 力 测试 (或 称 压力 测试 ) 开 始 。 
蛮 力 测试 


代码 有 问题 的 时 候 ， 就 要 求 变 力 测试 一 定 能 看 到 这 个 错误 。 这 就 意味 着 代码 要 运行 很 多 人 遍 ， 
可 能 会 有 很 多 线程 在 同一 时 间 运 行 。 要 是 有 bug 出 现 ， 只 能 线程 出 现 特殊 调度 的 时 候 ; 代码 运 
行 次 数 的 增加 ， 就 意味 着 bug 出 现 的 nd 多 。 当 有 几 次 代码 测试 通过 ， ee 的 
= o 。 如 果 连 续 运 行 10 次 都 通过 ， 你 就 会 更 有 信心 。 如 果 你 运行 十 亿 次 都 通 
>» 那么 你 就 会 认为 这 ee ne 


自信 的 来 源 是 每 次 测试 的 结果 。 如 果 你 的 测试 粒度 很 细 ， 就 像 测试 之 前 的 线程 安全 队列 ， 那 
么 蛮 力 测试 会 让 你 对 这 段 代码 持 有 高 度 的 自信 。 另 一 方面 ， 当 测试 对 象 体积 较 大 的 时 候 ， 调 
度 序 列 将 会 很 长 ， 即 使 运行 了 十 亿 次 测试 用 例 ， 也 不 让 你 对 这 上 段 代码 产生 什么 信心 。 


ee 
生 ， 那 么 怎么 运行 ， 测 试 都 不 会 失败 ， 可 能 会 因 环 境 的 原因 ， 出 现 几 次 失败 的 情况 。 最 糟糕 
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现 问 题 。 除 非 代 码 运 行 在 与 测试 机 系统 相同 的 系统 中 ， 不 过 特殊 的 硬件 和 操作 系统 的 因素 结 
合 起 来 ， 可 能 就 会 让 运行 环境 与 测试 环境 有 所 不 同 ， 问 题 可 能 就 会 随 之 出 现 。 


这 里 有 一 个 经 典 的 案例 ， 在 单 处 理 器 系统 上 测试 多 线程 应 用 。 因 为 每 个 线程 都 在 同一 个 处 理 
5 上 运行 ， 任 何事 情 都 是 串 行 的 ， 并 且 还 有 很 多 条 件 竞争 和 乒乓 缓存 ， 这 些 问题 可 能 在 卜 正 
的 多 处 理 器 系统 中 ， 根 本 不 会 出 现 。 还 有 其 他 变数 : 不 同 处 理 器 架构 提供 不 同 的 的 同步 和 内 
存 序 机 制 。 比 如 ， 在 x86 和 x86-64 架 构 上 ， 原 子 加 载 操 作 通 常 是 相同 的 ， 无 论 是 使 用 
memory_order_relaxed， 还 是 memory_order_seq_cst( 详 见 5.3.3 节 )。 这 就 意味 着 在 X86 架构 
上 使 用 松散 内 存 序 没有 问题 ， 但 在 有 更 精细 的 内 存 序 指令 集 的 架构 (比如 : SPARC) 下 ， 这 样 
使 用 就 可 能 产生 错误 。 


os (x 


如 果 你 希望 你 的 应 用 能 跨 平台 使 用 ， 就 要 在 相关 的 平台 上 进行 测试 。 这 就 是 我 把 处 理 器 架构 
也 列 在 测试 需要 考虑 的 清单 中 的 原因 ( 详 见 10.2.2) 。 


要 避免 误导 的 产生 ， 关 键 点 在 于 成 功 的 变 力 测试 。 这 就 需要 进行 仔细 考虑 和 设计 ， 不 仅仅 是 
选择 相关 单元 测试 ， 还 要 遵守 测试 系统 设计 准则 ， 以 及 选 定 测试 环境 。 保 证 代码 分 支 被 尽 可 
能 的 测试 到 ， 尽 可 能 多 的 测试 线程 间 的 互相 作用 。 还 有 ， 需 要 知道 哪 部 分 被 测试 覆盖 到 ， 哪 
些 没有 替 盖 。 


虽然 ， 蛮 力 测试 能 够 给 你 一 些 信心 ， 不 过 其 不 保证 能 找到 所 有 的 问题 。 如 果 有 时 间 将 下 面 的 
技术 应 用 到 你 的 代码 或 软件 中 ， 就 能 保证 所 有 的 问题 都 能 被 找到 。 


组 合 仿 卜 测试 


名 字 比 较 口 语 化 ， 我 需要 解释 一 下 这 个 测试 是 什么 意思 : 使 用 一 种 特殊 的 软件 ， 用 来 模拟 代 
码 运 行 的 丨 实情 况 。 你 应 该 知道 这 ， 能 让 一 台 物 理 机 上 运行 多 个 虚拟 环境 或 系统 环 

境 ， 而 硬件 环境 则 由 监控 软件 来 完成 。 除 了 环境 是 模拟 的 以 外 ， 模 拟 软 件 会 记录 对 数据 序列 
A ee te es Nene Haan SAT 
识别 条 件 竞 争 和 死 锁 。 


虽然 ， 这 种 组 合 测试 可 以 保证 所 有 与 系统 相关 的 问题 都 会 被 找到 ， 不 过 过 于 零碎 的 程序 将 会 
在 这 种 测试 中 耗费 太 长 时 间 ， 因 为 组 合 数目 和 执行 的 操作 数量 将 会 随 线 程 的 增多 呈 指 数 增长 
态势 。 这 个 测试 最 好 留 给 需要 细 粒 度 测 试 的 代码 段 ， 而 非 整个 应 用 。 另 一 个 缺点 就 是 ， 代 码 
对 操作 的 处 理 ， 往 往 会 依赖 与 模拟 软件 的 可 用 性 。 

所 以 ， 测 试 需要 在 正常 情况 下 ， 运 行 很 多 次 ， 不 过 这 样 可 能 会 错过 一 些 问 题 ; 也 可 以 在 一 些 
特殊 情况 下 运行 多 次 ， 不 过 这 样 更 像 是 为 了 验证 某 些 问题 。 

还 有 其 他 的 测试 选项 吗 ? 


第 三 个 选项 就 是 使 用 一 个 库 ， 在 运行 测试 的 时 候 ， 检 查 代码 中 的 问题 。 


使 用 专用 库 对 代码 进行 测试 


虽然 ， 这 个 选择 不 会 像 组 合 仿 幢 的 方式 提供 彻底 的 检查 ， 不 过 可 以 通过 特别 实现 的 库 ( 使 用 同 
步 原 语 ) 来 发 现 一 些 问题 ， 比 如 : 互 斥 量 ， 锁 和 条 件 变 量 。 例 如 ， 访 问 菜 块 公共 数据 的 时 候 ， 
就 要 将 指定 的 互 斥 量 上 锁 。 数 据 被 访问 后 ， 发 现 一 些 互 斥 量 已 经 上 锁 ， 就 需要 确定 相关 的 互 
斥 量 是 否 被 访问 线程 锁 住 ; 如 果 没有 ， 测 试 库 将 报告 这 个 错误 。 当 需要 测试 库 对 某 块 代码 进 
行 检查 时 ， 可 以 对 对 应 的 共享 数据 进行 标记 。 


当 不 止 一 个 互 斥 量 同 时 被 一 个 线程 特有， 测试 库 也 会 对 锁 的 序列 进行 记录 。 如 果 其 他 线程 以 
不 同 的 顺序 进行 上 锁 ， 即 使 在 运行 的 时 候 测试 用 例 没 有 发 生死 锁 ， 测 试 库 都 会 将 这 个 行为 记 
录 为 "有 洪 在 死 锁 " 可 能 。 


妆 测 试 多 线程 代码 的 时 候 ， 另 一 种 库 可 能 会 用 到 ， 以 线程 原 语 实现 的 库 ， 比 如 : 互 不 量 和 条 
件 变 量 ; 当 多 线程 代码 在 等 待 ， 或 是 被 条 件 变 量 通过 notify_one() 提 醒 的 某 个 线程 ， 测 试 者 可 
以 通过 线程 ， 获 取 到 锁 。 就 可 以 让 你 来 安排 一 些 特殊 的 情况 ， 以 验证 代码 是 否 会 在 这 些 特定 
的 环境 下 产生 期 望 的 结果 。 


C++ 标准 库 实现 中 ， 茶 些 测试 工具 已 经 存在 于 标准 库 中 ， 没 有 实现 的 测试 工具 ， 可 以 基于 标准 
库 进行 实现 。 


了 解 完 各 种 运行 测试 代码 的 方式 ， 将 让 我 们 来 了 解 一 下 ， 如 何以 你 想 要 的 调度 方式 来 构建 代 
码 。 


10.2.5 构建 多 线程 测试 代码 
10.2.2 节 中 提 过 ， 需 要 找 一 种 合适 的 调度 方式 来 处 理 测试 中 “同时 ”的 部 分 ， 现 在 就 是 解决 这 个 
问题 的 时 候 。 


在 特定 时 间 内 ， 你 需要 安排 一 系列 线程 ， 同 时 去 执行 指定 的 代码 段 。 最 简单 的 情况 : 两 个 线 
程 的 情况 ， 就 很 容易 扩展 到 多 个 线程 。 


首先 ， 你 需要 知道 每 个 测试 的 不 同 之 处 : 
。 环境 布置 代码 ， 必 须 首先 执行 
。 线程 设置 代码 ， 需 要 在 每 个 线程 上 执行 


。 线程 上 执行 的 代码 ， 需 要 有 并 发 性 


lr 


o 在 并 发 执行 结 来 后， 后续 代码 需要 对 代码 的 状态 进行 断言 检 


这 几 条 后 面 再 解释 ， 先 让 我 们 考虑 一 下 10.2.2 节 中 的 一 个 特殊 的 情况 : 一 个 线程 在 空 队列 上 调 
用 push()， 同 时 让 其 他 线程 调用 pop()。 


通常 ， 布 置 环境 的 代码 比较 简单 : 创建 队列 即 可 。 线 程 在 执行 pop() 的 时 候 ， 没 有 线程 设置 代 
码 。 线 程 设 置 代码 是 在 执行 push() 操 作 的 线程 上 进行 的 ， 其 依赖 与 队列 的 接口 和 对 象 的 存储 类 
型 。 如 果 存 储 的 对 象 需 要 很 大 的 开销 才能 构建 ， 或 必须 在 堆 上 分 配 的 对 象 ， 那 么 最 好 在 线程 
设置 代码 中 进行 构建 或 分 配 ; 这 样 ， 就 不 会 影响 到 测试 结果 。 另 外 ， 如 果 队 列 中 只 存 简单 的 
int 类 型 对 象 ， 构 建 int 对 象 时 就 不 会 有 太 多 额外 的 开销 。 实 际 上 ， 已 测试 代码 相对 简单 一 一 一 
个 线程 调用 push()， 另 一 个 线程 调用 pop() 一 一 那么 ，" 完 成 后 "的 代码 到 底 是 什么 样子 呢 ? 


在 这 个 例子 中 ，pop() 具 体 做 的 事情 ， 会 直接 影响 “完成 后 "代码 。 如 果 有 数据 块 ， 返回 的 肯定 
就 是 数据 了 ，push() 操 作 就 成 功 的 向 队列 中 推送 了 一 块 数据 ， 并 在 在 数据 返回 后 ， 队 列 依 归 是 
空 的 。 如 果 pop() 没 有 返回 数据 块 ， 也 就 是 队列 为 空 的 情况 下 ， 操 作 也 能 执行 ， 这 样 就 需要 两 
个 方向 的 测试 : 要 不 pop() 返 回 push() 推 送 到 队列 中 的 数据 块 ， 之 后 队列 依旧 为 空 ; 要 不 pop() 
会 示意 队列 中 没有 元 素 ， 但 同时 push() 向 队列 推送 了 一 个 数据 块 。 这 两 种 情况 都 是 真 实 存在 
的 ; 你 需要 避免 的 情况 是 : pop() 示 意 队 列 中 没有 数据 的 同时 ， 队 列 还 是 空 的 ， 或 pop() 返 回 数 
据 块 的 同时 ， 队 列 中 还 有 数据 块 。 为 了 简化 测试 ， 可 以 假设 pop() 是 可 阻塞 的 。 在 最 终 代码 
中 ， 需 要 用 断言 判断 弹出 的 数据 与 推 入 的 数据 ， 还 要 判断 队列 为 空 。 


现在 ， 了 解 了 各 个 代码 块 ， 就 需要 保证 所 有 事情 按 计 划 进 行 。 一 种 方式 是 使 用 一 

组 std::promise 来 表示 就 绪 状 态 。 每 个 线程 使 用 一 人 人 promise 来 表示 是 否 准 备 好 ， 然 后 

让 std::promise 等 待 (复制 ) 一 个 std: :shared_future ;主线 程 会 等 待 每 个 线程 上 的 promise 设 置 
后 ， 才 按 下 “开始 " 键 。 这 就 能 保证 每 个 线程 能 够 同时 开始 ， 并 且 在 准备 代码 执行 完成 后 ， 并 发 
代码 就 可 以 开始 执行 了 ; 任何 的 线程 特定 设置 都 需要 在 设置 线程 的 promise 前 完成 。 最 终 ， 主 
线程 会 等 待 所 有 线程 完成 ， 并 且 检 查 其 最 终 状 态 。 还 需要 格外 关心 的 是 一 一 异常 ， 所 有 线程 
在 准备 好 的 情况 下 ， 才 按 下 “开始 " 键 ; 否则 ， 未 准备 好 的 线程 就 不 会 运行 。 


下 面 的 代码 ， 构 建 了 这 样 的 测试 。 
清单 10.1 对 一 个 队列 并 发 调用 push() 和 pop() 的 测试 用 例 


void test_concurrent_push_and_pop_on_empty_queue( ) 


{ 





threadsafe_queue<int> q; // 1 


std::promise<void> go,push_ready,pop_ready; // 2 
std::shared_future<void> ready(go.get_future()); // 3 


std::future<void> push_done; // 4 
std::future<int> pop_done; 


try 
{ 
push_done=std::async(std::launch::async, // 5 
[&q, ready, &push_ready ] () 


push_ready.set_value(); 
ready.wait(); 
q.push(42); 


); 
pop_done=std::async(std::launch::async, // 6 
[&q, ready, &pop_ready]() 
{ 
pop_ready.set_value(); 
ready.wait(); 
return q.pop(); // 7 


); 
push_ready.get_future().wait(); // 8 
pop_ready.get_future().wait(); 
go.set_value(); // 9 


push_done.get(); // 10 
assert(pop_done.get()==42); // 11 
assert(q.empty()); 

} 

catch(...) 

{ 
go.set_value(); // 12 
throw; 


首先 ， 环 境 设 置 代 码 中 创建 了 空 队列 四。 然后 ， 为 准备 状态 创建 promise 对 象 @@， 并 且 为 go 信 
号 获取 一 个 std::shared_future 对 象 国 。 再 后 ， 创 建 了 future 用 来 表示 线程 是 否 结束 @。 这 些 
都 需要 放 在 try 块 外 面 ， 再 设置 go 信号 时 抛 出 异常 ， 就 不 需要 等 待 其 他 城市 线程 完成 任务 了 (这 
将 会 产生 死 锁 如 果 测 试 代码 产生 死 锁 ， 测 试 代码 就 是 不 理想 的 代码 )。 





try 块 中 可 以 局 动 线程 @@ 一 一 使 用 std::launch: :async 保证 每 个 任务 在 自己 的 线程 上 完成 。 注 
意 ， 使 用 std: :async 会 让 你 任务 更 容易 成 为 线程 安全 的 任务 3 这 里 不 用 普通 std::thread ， 
因为 其 析 构 函数 会 对 future 进 行 线程 汇 入 。lambda 有 函数 会 捕 提 指定 的 任务 (会 在 队列 中 引用 )， 
并 且 为 promise 准 备 相 关 的 信号 ， 同 时 对 从 go 中 获取 的 ready 做 一 份 找 贝 。 


如 之 前 所 说 ， 每 个 任务 集 都 有 自己 的 ready 信 号 ， 并 且 会 在 执行 测试 代码 前 ， 等 待 所 有 的 
ready 信 号 。 而 主线 程 不 同一 一 等 待 所 有 线程 的 信号 前 国 ， 提 示 所 有 线程 可 以 开始 进行 测试 了 





异步 调用 a nee ， 主 线程 会 从 中 获取 future ， 人 函数 获取 结 


最 终 ， 等 RF 
果 ， 最 后 对 结果 进行 检查 。 注 意 ， 这 里 pop 操 作 通 过 future 返 回 检索 值 @， 所 以 能 获取 最 终 的 


当 有 异常 抛 出 ， 需 要 通过 对 go 信号 的 设置 来 避免 巧 空 指针 的 产生 ， 再 重新 抛 出 异常 2。future 
与 之 后 声明 的 任务 相对 应 @@， 所 以 future 将 会 被 首先 销毁 ， 如 果 future 都 没有 就 绪 ， 析 构 函 数 
将 会 等 待 相关 任务 完成 后 执行 操作 。 


虽然 ， 像 是 使 用 测试 模板 对 两 个 调用 进行 测试 ， 但 使 用 类 似 的 东西 是 必要 的 ， 这 样 会 便于 测 

试 的 进行 。 例 如 ， 启 动 一 个 线程 就 是 一 个 很 耗 时 的 过 程 ， 如 果 没 有 线程 在 等 待 go 信 号 时 ， 推 

送 线程 可 能 会 在 弹出 线程 开始 之 前 ， 就 已 经 完成 了 ; 这 样 就 失去 了 测试 的 作用 。 以 这 种 方式 

使 用 future， 就 是 为 了 保证 线程 都 在 运行 ， 并 且 阻 塞 在 同一 个 future 上 。future 解 除 阻塞 后 ， 将 
会 让 所 有 线程 运行 起 来 。 当 你 熟悉 了 这 个 结构 ， 其 就 能 以 同样 的 模式 创建 新 的 测试 用 例 。 测 

试 两 个 以 上 的 线程 ， 这 种 模式 很 容易 进行 扩展 。 


目前 ， 我 们 已 经 了 解 了 多 线程 代码 的 正确 性 测试 。 


虽然 这 是 最 最 重要 的 问题 ， 但 是 其 不 是 我 们 做 测试 的 唯一 原因 : 多 线程 性 能 的 测试 同样 重 
要 。 


下 面 就 让 我 们 来 了 解 一 下 性 能 测试 。 


10.2.6 测试 多 线程 代码 性 能 


选择 以 并 发 的 方式 开发 应 用 ， 就 是 为 了 能 够 使 用 日 益 增 长 的 处 理 器 数量 ; 通过 处 理 器 数量 的 
增加 ， 来 提升 应 用 的 执行 效率 。 因 此 ， 确 定性 能 是 否 有 站 正 的 提高 就 很 重要 了 (就 像 其 他 优化 
一 样 ) 。 


并 发 效率 中 有 个 特别 的 你 希望 代码 能 很 快 的 运行 24 次 ， 或 在 24 芯 的 机 
器 上 对 数据 进 es 。 你 不 会 希望 ， 你 的 代码 运行 两 次 的 数据 
和 在 双 芯 机 器 上 执行 一 样 快 的 同时 ， 在 24 芯 的 机 器 上 会 更 慢 。 如 8.4.2 节 中 所 述 ， 当 有 重要 的 
代码 以 单线 程 方式 运行 时 ， 就 会 限制 性 能 的 提高 。 因 此 ， 在 做 测试 之 前 ， 回 顾 一 下 代码 的 设 
计 结 构 是 很 有 必要 的 ; 这 样 就 能 判断 ， 代码 在 24 芯 的 机 器 上 时 ， 性 能 会 不 会 提高 24 倍 ， 或 是 
因为 有 串 行 部 分 的 存在 ， 最 大 的 加 速 比 只 有 3。 








在 对 数据 访问 的 时 候 ， 处 理 器 之 间 会 有 竞争 ， 会 对 性 能 有 很 大 的 影响 。 需 要 合理 的 权衡 性 能 
和 处 理 器 的 数量 ， 处 理 器 数量 太 少 ， 就 会 等 竺 很久 ; 处 理 器 过 多 ， 又 会 因为 竞争 的 原因 等 待 
很 久 。 


因此 ， 在 对 应 的 系统 上 通过 不 同 的 配置 ， 检 查 多 线程 的 性 能 就 很 有 必要 ， 这 样 可 以 得 到 一 张 
性 能 伸缩 图 。 最 起 码 ，( 如 果 条 件 允 许 ) 你 应 该 在 一 个 单 处 理 器 的 系统 上 和 一 个 多 处 理 核 芯 的 系 
统 上 进行 测试 。 


10.3 本 章 总 结 


本 章 我 们 了 解 了 各 种 与 并 发 相关 的 bug， 从 死 锁 和 活 锁 ， 再 到 数据 竞争 和 其 他 恶性 条 件 竞争 ; 
我 们 也 使 用 了 一 些 技术 来 定位 bug。 同 样 ， 也 讨论 了 在 做 代码 审阅 的 时 候 需 做 哪些 思考 ， 以 及 
写 可 测试 代码 的 指导 意见 ， 还 有 如 何 为 并 发 代码 构造 测试 用 例 。 最 终 ， 我 们 还 了 解 了 一 些 对 
测试 很 有 帮助 的 工具 。 


\ 


附录 A 对 c++ 11 语 言 特性 的 简要 介绍 


新 的 cre 标准 ， 不 仅 带 来 了 对 并 发 的 支持 ， 也 将 其 他 语言 的 一 些 特性 带 入 标准 库 中 。 在 本 附 
录 中 ， 会 给 出 对 这 些 新 特性 进行 简要 介绍 (这 些 特性 用 在 线程 库 中 ) 。 除 了 thread_local( 详 见 
A.8 部 分 ) 以 外 ， 就 没有 与 并 发 直接 相关 的 内 容 了 ， 但 对 于 多 线程 代码 来 说 ， 它 们 都 是 很 重要 。 
我 已 只 列 出 有 必要 的 部 分 (例如 ， 右 值 引用 )， 这 样 能 够 使 代码 更 容易 理解 。 由 于 对 新 特性 不 

熟 ， 对 用 到 某 些 特性 的 代码 理解 起 来 会 有 一 些 困难 ; 没关系 ， 当 对 这 些 特性 渐渐 熟知 后 ， 就 
能 很 容易 的 理解 代码 。 由 于 cot 11 的 应 用 越 来 越 广泛 ， 这 些 特性 在 代码 中 的 使 用 也 将 会 变 越 
来 越 普遍 。 


话 不 多 说 ， 让 我 们 从 线程 库 中 的 右 值 引用 开始 ， 来 熟悉 对 象 之 间 所 有 权 ( 线 程 ， 锁 等 等 ) 的 转 
移 。 


A.1 右 值 引用 


如 果 你 从 事 过 c++ 编程 ， 你 会 对 引用 比较 熟悉 cH 的 引用 允许 你 为 已 经 存在 的 对 象 创建 一 
个 新 的 名 字 。 对 新 引用 所 做 的 访问 和 修改 操作 ， 都 会 影响 它 的 原型 。 


例如 : 


int var=42; 

int& ref=var; // 创建 一 个 var 的 引用 

ref=99; 

assert(var==99); // 原型 的 值 被 改变 了 ， 因 为 引用 被 赋值 了 





左 值 的 引用 。lvalue 这 个 词 来 自 于 C 语 
言 ， 指 的 是 可 以 放 在 赋值 表达 式 左边 ee 配 的 命名 对 象 ， 或 者 其 他 对 
象 成 员 有 明确 的 内 存 地 址 。rvalue 这 个 词 也 来 源 于 C 语 言 ， 指 的 是 可 以 出 现在 赋值 表达 式 
右 侧 的 对 象 一 例如， 文字 常量 和 临时 变量 。 因 此 ， 堪 值 引 用 只 能 被 绑 定 在 左 值 上 ， 而 不 是 
右 值 。 





int& i=42; // 编译 失败 


例如 ， 因 为 42 是 一 个 右 值 。 好 吧 ， 这 有 些 假 ; 你 可 能 通常 使 用 下 面 的 方式 讲 一 个 右 值 绑 定 到 
一 个 const 左 值 引 用 上 : 


int const& i = 42; 


这 算是 钻 了 标准 的 一 个 空子 吧 。 不 过 ， 这 种 情况 我 们 之 前 也 介绍 过 ， 我 们 通过 对 左 值 的 const 
引用 创建 临时 性 对 人 象 ， 作 为 参数 传递 给 函数 。 


其 允许 隐 式 转换 ， 所 以 你 可 这 样 写 : 


void print(std::string const& s); 
print("hello"); // 创 建 了 临时 std: :string 对 象 


as 准 介 绍 了 右 值 引用 (rvalue reference)， 这 种 方式 只 能 绑 定 右 值 ， 不 能 绑 定 左 值 ， 其 
过 两 个 && 来 进行 声明 : 


i 


int&& i=42; 
int j=42; 
int&& k=j; // 编译 失败 


因此 ， 可 以 使 用 函数 重 载 的 方式 来 确定 : 函数 有 左 值 或 右 值 为 参数 的 时 候 ， 看 是 否 能 被 同名 
且 对 应 参数 为 左 值 或 有 值 引用 的 函数 所 重 载 。 


其 基础 就 是 C++11 新 添 语 义 一 一 移动 语义 (move semantics) 。 


A.1.1 移动 语义 


右 值 通常 都 是 临时 的 ， 所 以 可 以 随意 修改 ; 如 果 知 道 函 数 的 某 个 参数 是 一 个 右 值 ， 就 可 以 将 
其 看 作为 一 个 临时 存储 或 “窃取 ”内 容 ， 也 不 影响 程序 的 正确 性 。 这 就 意味 着 ， 比 起 拷贝 右 值 参 
数 的 内 容 ， 不 如 移动 其 内 容 。 动 态 数组 比较 大 的 时 候 ， 这 样 能 节省 很 多 内 存 分 配 ， 提 供 更 多 
的 优化 空间 。 试 想 ， 一 个 函数 以 std::vector<int> 作为 一 个 参数 ， 就 需要 将 其 拷贝 进来 ， 而 
不 对 原始 的 数据 做 任何 操作 。 c++ 03/98 的 办 法 是 ， 将 这 个 参数 作为 一 个 左 值 的 const 引 用 传 
入 ， 然 后 做 内 部 拷贝 : 


void process_copy(std::vector<int> const& vec_) 


{ 
std::vector<int> vec(vec_); 
vec.push_back(42); 


这 就 允许 函数 能 以 左 值 或 右 值 的 形式 进行 传递 ， 不 过 任何 情况 下 都 是 通过 拷贝 来 完成 的 。 如 
果 使 用 右 值 引 用 版 本 的 函数 来 重 载 这 个 函数 ， 就 能 避免 在 传 入 右 值 的 时 候 ， 函 数 会 进行 内 部 
拷贝 的 过 程 ， 因 为 可 以 任意 的 对 原始 值 进行 修改 : 


void process_copy(std::vector<int> && vec) 


{ 
vec.push_back(42); 


如 果 这 个 问题 存在 于 类 的 构造 函数 中 ， 禄 取 内 部 右 值 在 新 的 实例 中 使 用 。 可 以 参考 一 下 清单 
中 的 例子 (默认 构造 函数 会 分 配 很 大 一 块 内 存 ， 在 析 构 函数 中 释放 )。 


清单 A.1 使 用 移动 构造 函数 的 类 


class X 

{ 

private: 
int* data; 


public: 
x(): 
data(new int[1000000]) 
{} 


~X() 
{ 
delete [] data; 


X(const X& other): // 1 
data(new int[1000000] ) 


{ 
std: :copy(other .data, other .data+1000000, data); 


X(X&& other): // 2 
data(other.data) 


other.data=nullptr; 
} 
}; 


一 般 情 况 下 ， 找 贝 构造 函数 @@ 都 是 这 么 定义 : 分 配 一 块 新 内 存 ， 然 后 将 数据 拷贝 进去 。 不 过 ， 

现在 有 了 一 个 新 的 构造 函数 ， 可 以 接受 右 值 引用 来 获取 老 数据 避 ， 就 是 移动 构造 函数 。 在 这 个 

例子 中 ， 只 是 将 指针 拷贝 到 数据 中 ， 将 other 以 空 指针 的 形式 留 在 了 新 实例 中 ; 使 用 右 值 里 创 
变量 ， 就 能 避免 了 空间 和 时 间 上 的 多 余 消耗 。 


X 类 (清单 A.1) 中 的 移动 构造 函数 ， 仅 作为 一 次 优化 ; 在 其 他 例子 中 ， 有 些 类 型 的 构造 函数 只 支 
持 移 动 构造 函数 ， 而 不 支持 拷贝 构造 函数 。 例 如 ， 智 能 指针 std::unique_ptr<> 的 非 空 实例 

中 ， 只 允许 这 个 指针 指向 其 对 象 ， 所 以 拷贝 函数 在 这 里 就 不 能 用 了 (如 果 使 用 拷贝 函数 ， 就 会 

有 两 个 std: :unique_ptr<> 指向 该 对 象 ， 不 满足 std: :unique_ptr<> 定义 )。 不 过 ， 移动 构造 函 

数 允 许 对 指针 的 所 有 权 > 在 实例 之 间 进 行 传递 ， 并 且 允 许 std: :unique_ptr<> 像 一 个 带 有 返回 

值 的 函数 一 样 使 用 指针 的 转移 是 通过 移动 ， 而 非 找 贝 。 





如 果 你 已 经 知道 ， 茶 个 变量 在 之 后 就 不 会 在 用 到 了 ， 这 时 候 可 以 选择 显 式 的 移动 ， 你 可 以 使 
用 static_cast<X&&> 将 对 应 变量 转换 为 右 值 ， 或 者 通过 调用 std: :move() 元 数 来 做 这 件 事 : 


x x1; 
X x2=std: :move(x1); 
X x3=static_cast<X&&>(x2); 


想 要 将 参数 值 不 通过 拷贝 ， 转 化 为 本 地 变量 或 成 员 变量 时 ， 就 可 以 使 用 这 个 办 法 ; 虽然 右 值 
引用 参数 绑 定 了 右 值 ， 不 过 在 元 数 内 部 ， 会 当做 左 值 来 进行 处 理 : 


void do_stuff(X&& x_) 
{ 
X a(x_); // 拷贝 
X b(std::move(x_)); // 移动 


} 
do_stuff(X()); // ok， 右 值 绑 定 到 右 值 引用 上 
X X; 


do_stuff(x); // 错误 ， 左 值 不 能 绑 定 到 右 值 引用 上 


移动 语义 在 线程 库 中 用 的 比较 广泛 ， 无 拷贝 操作 对 数据 进行 转移 可 以 作为 一 种 优化 方式 ， 

免 对 将 要 被 销毁 的 变量 进行 额外 的 拷贝 。 在 2.2 节 中 看 到 ， 在 线程 中 使 用 std: :move() $F 

移 std: :unique_ptr<> 得 到 一 个 新 实例 ; 在 2.3 节 中 ， 了 解 了 在 std:thread 的 实例 间 使 用 移动 
语义 ， 用 来 转移 线程 的 所 有 权 。 


std::thread ` std::unique_lock<> ` std::future<> ` 

std::promise<> 和 std::packaged_task<> 都 不 能 拷贝 ， 不 过 这 些 类 都 有 移动 构造 函数 ， 能 让 
相关 资源 在 实例 中 进行 传递 ， denn de 直行 返 

EJ o std::string 和 std::vector<> 也 可 以 拷贝 ， 不 过 它们 也 有 移动 构造 函数 和 移动 赋值 操作 
符 ， 就 是 为 了 避免 拷贝 拷贝 大 量 数据 。 


C++ 标准 库 不 会 将 一 个 对 象 显 式 的 转移 到 另 一 个 对 象 中 ， 除 非 将 其 销毁 的 时 候 或 对 其 赋值 的 时 

候 (拷贝 和 移动 的 操作 很 相似 )。 不 过 ， 实 践 中 移动 能 保证 类 中 的 所 有 状态 保持 不 变 ， 表 现 良 
好 。 一 个 std::thread 实例 可 以 作为 移动 源 ， ， 转移 到 新 (以 默认 构造 方式 ) 的 std::thread 实例 
中 。 还 有 ， std: :string 可 以 通 过 移动 原始 数据 进行 构造 ， 并 且 保 留 原始 数据 的 状态 ， 不 过 不 
能 保证 的 是 原始 数据 中 该 状态 是 否 正确 (根据 字符 串 长 度 或 字符 数量 决定 ) 。 


A.1.2 右 值 引 用 和 函数 模板 


在 使 用 右 值 引用 作为 函数 模板 的 参数 时 ， 与 之 前 的 用 法 有 些 不 同 : 如 果子 数 模板 参数 以 右 值 
引用 作为 一 个 模板 参数 ， 当 对 应 位 置 提供 左 值 的 时 候 ， 模 板 会 自动 将 其 类 型 认定 为 左 值 引 
用 ; 当 提 供 右 值 的 时 候 ， 会 当做 普通 数据 使 用 。 可 能 有 些 口语 化 ， 来 看 几 个 例子 吧 。 


考虑 一 下 下 面 的 函数 模板 : 
template<typename T> 


void foo(T&& t) 
{} 


随后 传 入 一 个 右 值 ，T 的 类 型 将 被 推导 为 : 
foo(42); // foo<int>(42) 


foo(3.14159); // foo<double><3.14159> 
foo(std::string()); // foo<std::string>(std::string()) 


不 过 ， 向 foo 传 入 左 值 的 时 候 ，T 会 被 推导 为 一 个 左 值 引用 : 


Teak a es 
foo(i); // foo<int&>(i) 


因为 函数 参数 声明 为 tee ， 所 以 就 是 引用 的 引用 ， 可 以 视 为 是 原始 的 引用 类 型 。 那 么 foo() 就 
相当 于 : 


foo<int&>(); // void foo<int&>(int& t); 


这 就 允许 一 个 函数 模板 可 以 即 接受 左 值 ,又 可 以 接受 右 值 参数 ; 这 种 方式 已 经 
被 std::thread 的 构造 函数 所 使 用 (2.1 节 和 2.2 节 )， 所 以 能 够 将 可 调用 对 象 移动 到 内 部 存储 ， 
而 非 当 参数 是 右 值 的 时 候 进行 拷贝 。 


A.2 删除 函数 


有 时 让 类 去 做 拷贝 是 没有 意义 的 。 std::mutex 就 是 一 个 例子 一 一 拷贝 一 个 互 斥 量 ， 意 义 何 
在 ? std::unique_lock<> 是 另 一 个 例子 一 一 一 个 实例 只 能 拥有 一 个 锁 ; 如 果 要 复制 ， 拷 贝 的 
那个 实例 也 能 获取 相同 的 锁 ， 这 样 std: :unique_lock<> 就 没有 存在 的 意义 了 。 实 例 中 转移 所 
有 权 (A.1.2 节 ) 是 有 意义 的 ， 其 并 不 是 使 用 的 拷贝 。 当 然 其 他 例子 就 不 一 一 列举 了 。 


通常 为 了 避免 进行 拷贝 操作 ， 会 将 拷贝 构造 另 数 和 拷贝 赋值 操作 符 声 明 为 私 有 成 员 ， 并 且 不 
进行 实现 。 如 果 对 实例 进行 拷贝 ， 将 会 引起 编译 错误 ; ORAL MRA BARAT BRME 
拷贝 一 个 实例 ， 那 将 会 引起 链接 错误 (因为 缺少 实现 ) : 


class no_copies 
{ 
public: 
no_copies(){} 
private: 
no_copies(no_copies const&); // 无 实现 
no_copies& operator=(no_copies const&); // 无 实现 


a 


no_copies a; 
no_copies b(a); // 编译 错误 


在 C++11 中 ， 委 员 会 意识 到 这 种 情况 ， 但 是 没有 意识 到 其 会 带 来 攻击 性 。 因 此 ， 委 员 会 提供 了 
更 多 的 通用 机 制 : 可 以 通过 添加 = delete 将 一 个 函数 声明 为 删除 函数 。 


no_copise 类 就 可 以 写 为 : 


class no_copies 
{ 
public: 
no_copies(){} 
no_copies(no_copies const&) = delete; 
no_copies& operator=(no_copies const&) = delete; 


ia 


这 样 的 描述 要 比 之 前 的 代码 更 加 清晰 。 也 允许 编译 器 提供 更 多 的 错误 信息 描述 ， 当 成 员 函 数 
想 要 执行 拷贝 操作 的 时 候 ， 可 将 连接 错误 转移 到 编译 时 。 


拷贝 构造 和 拷贝 赋值 操作 删除 后 ， 需 要 显 式 写 一 个 移动 构造 函数 和 移动 赋值 操作 符 ， 
与 std::thread 和 std: :unique_lock<> 一 样 ， 你 的 类 是 只 移动 的 。 


下 面 清单 中 的 例子 ， 就 展示 了 一 个 只 移动 的 类 。 


清单 A.2 只 移动 类 


class move_only 
{ 
std::unique_ptr<my_class> data; 
public: 
move_only(const move_only&) = delete; 
move_only(move_only&& other): 
data(std: :move(other.data) ) 
{} 
move_only& operator=(const move_only&) = delete; 
move_only& operator=(move_only&& other ) 
{ 
data=std: :move(other.data); 
return *this; 
} 
J; 


move_only m1; 
move_only m2(m1); // 错误 ， 拷 贝 构造 声明 为 “已 删除 ” 
move_only m3(std::move(m1)); // OK»? 找到 移动 构造 函数 


只 移动 对 象 可 以 作为 函数 的 参数 进行 传递 ， 并 且 从 函数 中 返回 ， 不 过 当 想 要 移动 左 值 ， 通 常 


需要 显 式 的 使 用 std: :move() 或 static_cast<T&&> ° 


可 以 为 任意 函数 添加 = delete 说 明 符 ， 添 加 后 就 说 明 这 些 函 数 是 不 能 使 用 的 。 当 然 ， 还 可 以 
用 于 很 多 的 地 方 ; 删除 函数 可 以 以 正常 的 方式 参与 重 载 解析 ， 并 且 如 果 被 使 用 只 会 引起 编译 
错误 。 这 种 方式 可 以 用 来 删除 特定 的 重 载 。 比 如 ， 当 函数 以 short 作 为 参数 ， 为 了 避免 扩展 为 
int 类 型 ， 可 以 写 出 重 载 函 数 (以 int 为 参数 ) 的 声明 ， 然 后 添加 删除 说 明 符 : 


void foo(short); 
void foo(int) = delete; 


现在 ， 任 何 向 foo 函 数 传 递 int 类 型 参数 都 会 产生 一 个 编译 错误 ， 不 过 调用 者 可 以 显 式 的 将 其 他 
类 型 转化 为 short : 


foo(42); // 错误 ，int 重 载 声明 已 经 删除 
foo((short)42); // OK 


A.3 RU BK 


删除 函数 的 函数 可 以 不 进行 实现 ， 上 默认 函数 就 则 不 同 : 编译 器 会 创建 函数 实现 ， 通 常 都 是 “ 默 
认 ” 实 现 。 当 然 ， 这 些 函 数 可 以 直接 使 用 (它们 都 会 自动 生成 ) : 默认 构造 函数 ， 析 构 函 数 ， 拷 
贝 构造 函数 ， 移 动 构造 函数 ， 拷 贝 赋值 操作 符 和 移动 赋值 操作 符 。 


为 什么 要 这 样 做 呢 ? 这 里 列 出 一 些 原因 : 


。 改变 函数 的 可 访问 性 一 编译 器 生成 的 默认 函数 通常 都 是 声明 为 public( 如 果 想 让 其 为 
protected 或 private 成 员 ， 必 须 自己 实现 )。 将 其 声明 为 默认 ， 可 以 让 编译 器 来 帮助 你 实现 
函数 和 改变 访问 级 别 。 








编译 器 生成 版 本 已 经 足够 使 有 用， 那么 显 式 声明 就 利于 其 他 人 阅读 这 段 代 
码 ， 会 让 代码 结构 看 起 来 很 清晰 。 


© 没有 单独 实现 的 时 候 ， 编 译 器 自动 生成 函数 一 一 通常 默认 构造 函数 来 做 这 件 事 ， 如 果 用 
户 没有 定义 构造 函数 ， 编 译 器 将 会 生成 一 个 。 当 需要 自 定 一 个 拷贝 构造 函数 时 (假设 )， 如 
果 将 其 声明 为 默认 ， 也 可 以 获得 编译 器 为 你 实现 的 拷贝 构造 函数 。 


© FIFE + RETA BR © 
e 声明 一 个 特殊 版 本 的 拷贝 构造 函数 ， 比 如 : 参数 类 型 是 非 const 引 用 ， 而 不 是 const 引 用 。 


o 利用 编译 生成 函数 的 特殊 性 质 ( 如 果 提 供 了 对 应 的 函数 ， 将 不 会 自动 生成 对 应 函数 一 会 
在 后 面具 体 讲解 ) 。 


就 像 删 除 wy He HE 次 数 后 面 添加 = = delete 一 样 2 Ri BRE 要 在 函数 后 面 添加 = = default ° 
例如 : 


class Y 
{ 
private: 
Y() = default; // 改变 访问 级 别 
public: 
Y(Y&) = default; // 以 非 const 引 用 作为 参数 
T& operator=(const Y&) = default; // 作为 文档 的 形式 ， 声 明 为 默认 有 函数 
protected: 
virtual ~Y() = default; // 改变 访问 级 别 ， 以 及 添加 庶 函 数 标签 
J; 


编译 器 生成 函数 都 有 独特 的 特性 ， 这 是 用 户 定义 版 本 所 不 具备 的 。 最 大 的 区 别 就 是 编译 器 生 
成 的 函数 都 很 简单 。 


列 出 了 几 点 重要 的 特性 


。 对 象 具 有 简单 的 拷贝 构造 函数 ， 拷 贝 赋值 操作 符 和 析 构 函数 ， 都 能 通过 memcpy 或 
memmove 进 行 拷贝 。 


字面 类 型 用 于 constexpr 亟 数 ( 可 见 A.4 节 )， 必 须 有 简单 的 构造 ， 拷 贝 构造 和 析 构 函数 。 


类 的 默认 构造 ， 拷 贝 ， 拷 贝 赋值 操作 符合 析 构 函数 ， 也 可 以 用 在 一 个 已 有 构造 和 析 构 区 
数 (用 户 定义 ) 的 联合 体内 。 


e 类 的 简单 拷贝 赋值 操作 符 可 以 使 用 std::atomic<> 类 型 模板 ( 见 5.2.6 节 ) ， 为 某 种 类 型 的 值 
提供 原子 操作 。 


C = default eoo 得 简单 一 如 果 类 还 支持 其 他 相关 标准 的 函数 ， 那 这 个 函数 
日 xk ， 用 户 显 式 的 实现 就 不 会 让 这 些 函 数 变 简单 。 




















第 二 个 区 别 ， 编 译 器 EE A ee eS ee 
以 看 作为 一 个 aggregate， 并 且 可 以 通过 聚合 初始 化 函数 进行 初始 化 : 


struct aggregate 

{ 
aggregate() = default; 
aggregate(aggregate const&) = default; 
int a; 
double b; 

J; 

aggregate x={42,3.141}; 


例子 中 ，x.a 被 42 初 始 化 ，x.b 被 3.141 初 始 化 。 


第 三 个 区 别 ， 编 译 器 生成 的 函数 只 适用 于 构造 函数 ; 换 名 话说 ， 只 适用 于 符合 某 些 标准 的 黑 
认 构 造 函 数 。 


struct X 
{ 

int a; 
F: 


如 果 创 建 了 一 个 X 的 实例 (未 初始 化 )， 其 中 int(a) 将 会 被 默认 初始 化 。 


如 果 对 象 有 静态 存储 过 程 ， 那 么 a 将 会 被 初始 化 为 0 ; 另外 ， 当 a 没 赋 值 的 时 候 ， 其 不 定 值 可 能 
会 触发 未 定义 行为 : 


X x1; // x1.a 的 值 不 明确 


另外 ， 当 使 用 显示 调用 构造 函数 的 方式 对 X 进 行 初 始 化 ，a 就 会 被 初始 化 为 0 : 


X x2 = X(); // x2.a == 0 


这 种 奇怪 的 属性 会 扩展 到 基础 类 和 成 员 函 数 中 。 当 类 的 默认 构造 函数 是 由 编译 器 提供 ， 并 且 
一 些 数据 成 员 和 基 类 都 是 有 编译 器 提供 默认 构造 函数 时 ， 还 有 基 类 的 数据 成 员 和 该 类 中 的 数 
据 成 员 都 是 内 置 类 型 的 时 候 ， 其 值 要 不 就 是 不 确定 的 ， 要 不 就 是 被 初始 化 为 0( 与 默认 构造 函数 
是 否 能 被 显 式 调用 有 关 ) 。 


虽然 这 条 规则 令 人 困 感 ， 并 且 容 易 造 成 错误 ， 不 过 也 很 有 用 ; 当 你 编写 构造 函数 的 时 候 ， 就 
不 会 用 到 这 个 特性 ; 数据 成 员 ， 通 常 都 可 以 被 初始 化 (指定 了 一 个 值 或 调用 了 显 式 构造 函数 )， 
或 不 会 被 初始 化 (因为 不 需要 ) : 


X::X():a(){} // a == 0 
X::X():a(42){} // a == 42 
X::X(){} //1 


第 三 个 例子 中 加， 省略 了 对 a 的 初始 化 ，X 中 a 就 是 一 个 未 被 初始 化 的 非 静 态 实 例 ， 初 始 化 的 X 
实例 都 会 有 静态 存储 过 程 。 


通常 的 情况 下 ， 如 果 写 了 其 他 构造 泡 数 ， 编 译 器 就 不 会 生成 默认 构造 函数 。 所 以 ， 想 要 自己 
写 一 个 的 时 候 ， 就 意味 着 你 放弃 了 这 种 奇怪 的 初始 化 特性 。 不 过 ， 将 构造 函数 显示 声明 成 默 
认 ， 就 能 强制 编译 器 为 你 生成 一 个 默认 构造 函数 ， 并 且 刚 才 说 的 那 种 特性 会 保留 : 


X::X() = default; // 应 用 默认 初始 化 规则 


这 种 特性 用 于 原子 变量 ( 见 5.2 节 )， 默 认 构造 函数 显 式 为 默认 。 初 始 值 通常 都 没有 定义 ， 除 非 
具有 (a) 一 个 静态 存储 的 过 程 (静态 初始 化 为 0) ，(b) 显 式 调用 默认 构造 函数 ， 将 成 员 初 始 化 为 

0，(c) 指 定 一 个 特殊 的 值 。 注 意 ， 这 种 情况 下 的 原子 变量 ， 为 允许 静态 初始 化 过 程 ， 构 造 函 数 
会 通过 一 个 声明 为 constexpr( 见 A.4 节 ) 的 值 为 原子 变量 进行 初始 化 。 


A.4 第 量 表达 式 函 数 


整 型 字面 值 ， 例 如 42， 就 是 常量 表达 式 。 所 以 ， 简 单 的 数学 表达 式 ， 例 如 ，23Xx2-4。 可 以 使 
用 其 来 初始 化 const 整 型 变量 ， 然 后 将 const 整 型 变量 作为 新 表达 的 一 部 分 : 


const int i=23; 

const int two_i=i*2; 

const int four=4; 

const int forty _two=two_i-four; 


使 用 常量 表达 式 创建 变量 也 可 用 在 其 他 常量 表达 式 中 ， 有 些 事 只 能 用 常量 表达 式 去 做 : 


hd 


e 指定 数组 长 度 : 


int bounds=99; 

int array[bounds]; // 错误 ，bounds 不 是 一 个 常量 表达 式 
const int bounds2=99; 

int array2[bounds2]; // 正确 ， bounds2 是 一 个 常量 表达 式 


。 指定 非 类 型 模板 参数 的 值 : 


template<unsigned size> 
struct test 


{}; 
test<bounds> ia; // 错误 ，bounds 不 是 一 个 常量 表达 式 
test<bounds2> ia2; // 正确 ;bounds2 是 一 个 常量 表达 式 


e 对 类 中 static const 整 型 成 员 变 量 进行 初始 化 : 


class X 


i 


static const int the_answer=forty_two; 


ty 


e 对 内 置 类 型 进行 初始 化 或 可 用 于 静态 初始 化 集合 : 


Struct my_aggregate 
{ 
int a; 
int b; 
}; 
static my_aggregate mai={forty_two,123}; // 静态 初始 化 
int dummy=257; 
static my_aggregate ma2={dummy, dummy}; // 动态 初始 化 


© 静态 初始 化 可 以 避免 初始 化 顺序 和 条 件 变 量 的 问题 。 


这 些 都 不 是 新 添加 的 一 一 你 可 以 在 1998 版 本 的 C++ 标 准 中 找到 对 应 上 面 实 例 的 条 款 。 不 过 ， 
新 标准 中 常量 表达 式 进行 了 扩展 ， 并 添加 了 新 的 关键 字 





constexpr ° 


constexpr 会 对 功能 进行 修改 ， 当 参数 和 函数 返回 类 型 符合 要 求 ， 并 且 实 现 很 简单 ， 那 么 这 
样 的 函数 就 能 够 被 声明 为 constexpr ， 这 样 函 数 可 以 当做 常数 表达 式 来 使 用 : 


constexpr int square(int x) 


{ 


return x*x; 


} 


int array[square(5)]; 


在 这 个 例子 中 ， array 有 25 个 元 素 ? Al A square $ žr 69 # 明 为 constexpr ° 当然 ， 这 种 方式 可 
以 当做 常数 表达 式 来 使 用 ， 不 意味 着 什么 情况 下 都 是 能 够 自动 转换 为 常数 表达 式 : 


int dummy=4; 
int array[square(dummy)]; // 错误 ，dummy 不 是 常数 表达 式 


dummy 不 是 常数 表达 式 ， 所 以 square(dummy) 也 不 是 一 一 就 是 一 个 普通 函数 调用 一 一 所 以 其 


不 能 用 来 指定 array 的 长 度 。 
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A.4.1 常量 表达 式 和 自 定 义 类 型 
目前 为 止 的 例子 都 是 以 内 置 int 型 展开 的 。 不 过 ， 在 新 C++ 标 准 库 中 ， 对 于 满足 字面 类 型 要 求 
的 任何 类 型 ， 都 可 以 用 常量 表达 式 来 表示 。 
要 想 划 分 到 字面 类 型 中 ， 需 要 满足 一 下 几 点 : 


。 一 般 的 拷贝 构造 函数 。 


。 一 般 的 析 构 函数 。 
e 所 有 成 员 变量 都 是 非 静 态 的 ， 且 基 类 需要 是 一 般 类 型 。 
。 必须 具有 一 个 一 般 的 默认 构造 函数 ， 或 一 个 constexpr 构 造 函 数 。 
后 面 会 了 解 一 下 constexpr 构 造 函 数 。 
现在 ， 先 将 注意 力 集中 在 默认 构造 函数 上 ， 就 像 下 面 清单 中 的 CX 类 一 样 。 


清单 A.3 (一 般 ) 默 认 构造 函数 的 类 


class CX 
{ 
private: 
int a; 
int b; 
public: 
cx() = default; // 1 
CX(int a_, int b_): // 2 
a(a_),b(b_) 
{} 
int get_a() const 
{ 
return a; 
} 
int get_b() const 
{ 
return b; 
} 
int foo() const 
{ 
return a+b; 
} 
}; 


SE TREE AS Pi TN OAT)? 为 了 保存 用 户 定义 的 构造 函数 @。 因 
此 ， 这 种 类 型 符合 字面 类 型 的 要 求 ， 可 以 将 其 用 在 常量 表达 式 中 。 


可 以 提供 一 个 constexpr 函 数 来 创建 一 个 实例 ， 例 如 : 


constexpr CX create_cx() 


{ 
return CX(); 


wT VA 4 3E — A fe] 4 AY constexpr HAAG WKAR : 


constexpr CX clone(CX val) 


i 


return val; 


Ait > constexpr $ žk R A H *econstexpr HA T AAAA > CXX F E ARD BA Fey ie H 
数 为 constexpr : 


class CX 
{ 
private: 
int a; 
int b; 
public: 
cx() = default; 
constexpr CX(int a_, int b_): 


a(a_),b(b_) 
{} 
constexpr int get a() const // 1 
{ 
return a; 
} 
constexpr int get_b() // 2 
{ 
return b; 
} 
constexpr int foo() 
{ 
return a+b; 
} 


HF 


注意 ，const 对 于 get_a()@ 来 说 就 是 多 余 的 ， 因 为 在 使 用 constexpr 时 就 为 const 了 ， 所 以 const 
普 述 符 在 这 里 会 被 忽略 。 


这 就 允许 更 多 复杂 的 constexpr 函 数 存 在 : 


constexpr CX make_cx(int a) 


{ 

return CX(a,1); 
} 
constexpr CX half_double(CX old) 
{ 

return CX(old.get_a()/2,o0ld.get_b()*2); 
} 
constexpr int foo_squared(CX val) 
{ 

return square(val.foo()); 
} 


int array[foo_squared(half_double(make_cx(10)))]; // 49 个 元 素 


函数 都 很 有 趣 ， 如 果 想 要 计算 数组 的 长 度 或 一 个 整 型 常量 ， 就 需要 使 用 这 种 方式 。 最 大 的 好 
处 是 常量 表达 式 和 constexpr 有 函数 会 设计 到 用 户 定义 类 型 的 对 象 ， | 这 些 函 数 对 这 些 对 
象 进行 初始 化 。 因 为 常量 表达 式 的 初始 化 过 程 是 静态 初始 化 ， 所 以 就 能 避免 条 件 竞争 和 初始 
化 顺序 的 问题 : 


CX si=half_double(CX(42,19)); // 静态 初始 化 


当 构 造 函 数 被 声明 为 constexpr， 且 构造 函数 参数 是 常量 表达 式 时 ， 那 么 初始 化 过 程 就 是 常数 
初始 化 (可 能 作为 静态 初始 化 的 一 部 分 )。 随 着 并 发 的 发 展 ，C++11 标 准 中 有 一 个 重要 的 改变 : 
允许 用 户 定 义 构 造 函 数 进行 静态 初始 化 ， 就 可 以 在 初始 化 的 时 候 避 免 条 件 竞争 ， 因 为 静态 过 
程 能 保证 初始 化 过 程 在 代码 运行 前 进行 。 


特别 是 关于 std: :mutex ( 见 3.2.1 节 ) 或 std::atomic<> ( 见 5.2.6 节 ) ， 当 想 要 使 用 一 个 全 局 实例 来 
同步 其 他 变量 的 访问 时 ， 同 步 访问 就 能 避免 条 件 竞 争 的 发 生 。 构 造 函 数 中 ， 互 斥 量 不 可 能 产 
生 条 件 竞争 ， 因 此 对 于 std: :mutex 的 默认 构造 函数 应 该 被 声明 为 Constexpr， 为 了 保证 互 斤 量 
初始 化 过 程 是 一 个 静态 初始 化 过 程 的 一 部 分 


A.4.2 ERANTZ 


目前 ， 已 经 了 解 了 constexpr 在 函数 上 的 应 用 。constexpr 也 可 以 用 在 对 象 上 ， 主 要 是 用 来 做 判 
断 的 ; 验证 对 象 是 否 是 使 用 常量 表达 式 ，constexpr 构 造 函 数 或 组 合 常量 表达 式 进行 初始 化 。 


且 这 个 对 象 需要 声明 为 const : 


constexpr int i=45; // ok 
constexpr std::string s(“hello”); // 错误 ，std::string 不 是 字面 类 型 


int foo(); 
constexpr int j=foo(); // 错误 ，foo() 没 有 声明 为 constexpr 


A.4.3 第 量 表达 式 函 数 的 要 求 


将 一 个 函数 声明 为 constexpr， 也 是 有 几 点 要 求 的 ; 当 不 满足 这 些 要 求 ，constexpr 声 明 将 会 报 
编译 错误 。 


= 


。 所 有 参数 都 必须 是 字面 类 型 。 


= 


e 返回 类 型 必须 是 字面 类 型 。 

© 函数 体内 必须 有 一 个 return 。 

ereturn 的 表达 式 需 要 满足 常量 表达 式 的 要 求 。 

o 构造 返回 值 /表达 式 的 任何 构造 函数 或 转换 操作 ， 都 需要 是 constexpr 。 


看 起 来 很 简单 ， 要 在 内 联 函 数 中 使 用 到 常量 表达 式 ， 返 回 的 还 是 个 常量 表达 式 ， 还 不 能 对 任 
AT RAT PLA o constexprH A st xe HE HY) IE 19 HAR o 


constexpr 类 成 员 函 数 ， 需 要 追加 几 点 要 求 : 

© constexprm& i Hak FH AEE HE BHA © 

© 对 应 类 必须 有 字面 类 的 成 员 。 

constexpr 构 造 函 数 的 规则 也 有 些 不 同 : 

o 构造 函数 体 必 须 为 空 。 

e 每 一 个 基 类 必须 可 初始 化 。 

。 每 个 非 静 态 数据 成 员 都 需要 初始 化 。 

© 初始 化 列表 的 任何 表达 式 ， 必 须 是 常量 表达 式 。 

o 构造 函数 可 选择 要 进行 初始 化 的 数据 成 员 ， 并 且 基 类 必须 有 constexpr 构 造 函 数 。 


o 任何 用 于 构建 数据 成 员 的 构造 函数 和 转换 操作 ， 以 及 和 初始 化 表达 式 相 关 的 基 类 必须 为 
constexpr ° 


这 些 条 件 同 样 适用 于 成 员 子 数 ， 除 非 函 数 没 有 返回 值 ， 也 就 没有 return 语 多。 


另外 ， 构 造 函 数 对 初始 化 列表 中 的 所 有 基 类 和 数据 成 员 进行 初始 化 。 一 般 的 拷贝 构造 函数 会 
隐 式 的 声明 为 constexpr 。 


A.4.4 常量 表达 式 和 模板 


将 constexpr 应 用 于 函数 模板 ， 或 一 个 类 模板 的 成 员 函 数 ; 根据 和 参数， 如果 模板 的 返回 类 型 不 
是 字面 类 ， 编 译 器 会 忽略 其 常量 表达 式 的 声明 。 当 模板 参数 类 型 合适 ， 且 为 一 般 inline 函 数 ， 
就 可 以 将 类 型 写成 constexpr 类 型 的 函数 模板 。 


template<typename T> 
constexpr T sum(T a,T b) 
{ 


return a+b; 


} 


constexpr int i=sum(3,42); // ok» sum<int>constexpr 
std::string s= 
sum(std::string("hello"), 
std::string(" world")); // 也 行 ， 不 过 Sum<std: :string> 就 不 是 
constexpr 了 


函数 需要 满足 所 有 constexpr 函 数 所 需 的 条 件 。 不 能 用 多 个 constexpr 来 声明 一 个 函数 ， 因 为 其 
是 一 个 模板 ; 这 样 也 会 带 来 一 些 编译 错误 。 


A.5 Lambda % žr 


lambda Barz c++ 11 中 的 加 入 很 是 令 人 兴奋 ， 因 为 lambda 有 函数 能 够 大 大 简化 代码 复杂 度 ( 语 
法 糖 : 利于 理解 具体 的 功能 )， 训 免 实 现 调用 对 象 。 c++ 11 的 lambda 骂 数 语法 允许 在 需要 使 用 
BY AY AR EAT ESL ABA AF BA > Hi) to std::condition_variable (如 同 4.1.1 节 中 的 例子 ) 提 供 
很 好 谓词 函数 ， 其 语义 可 以 用 来 快速 的 表示 可 访问 的 变量 ， 而 非 使 用 类 中 函数 来 对 成 员 变 量 
进行 捕获 。 


最 简单 的 情况 下 ，lambda 表 达 式 就 一 个 自给 自足 的 函数 ， 不 需要 传 入 函数 仅 依 赖 管 局 变量 和 
函数 ， 甚 至 都 可 以 不 用 返回 一 个 值 。 这 样 的 lambda 表 达 式 的 一 系列 语义 都 需要 封闭 在 括号 
中 ， 还 要 以 方 括号 作为 前 级 : 


[]{ // lambda 表 达 式 以 [] 开 始 
do_stuff(); 
do_more_stuff(); 

}(); // 表达 式 结束 ， 可 以 直接 调用 


例子 中 ，lambda 表 达 式 通过 后 面 的 括号 调用 ， 不 过 这 种 方式 不 常用 。 一 方面 ， 如 果 想 要 直接 
调用 ， 可 以 在 写 完 对 应 的 语句 后 ， 就 对 函数 进行 调用 。 对 于 函数 模板 ， 传 递 一 个 参数 进去 时 
很 常见 的 事情 ， 其 至 可 以 将 可 调用 对 象 作为 其 参数 传 入 ; 可 调用 对 象 通常 也 需要 一 些 参数 ， 
或 返回 一 个 值 ， 亦 或 两 者 都 有 。 如 果 想 给 lambda 函 数 传递 参数 ， 可 以 参考 下 面 的 lambda 函 
数 ， 其 使 用 起 来 就 像 是 一 个 普通 函数 。 人 例如， 下面 代码 是 将 vector 中 的 元 素 使 用 std::cout 进 
行 打 印 : 


std::vector<int> data=make_data(); 
std::for_each(data.begin(),data.end(),[](int i) 
{std: :cout<<i<<"\n";}); 


REAL eR hl BAY > Slambda wack 4s — returns 4) > Rea KA HH Alambdak 
达 式 的 返回 类 型 。 例 如 ， 使 用 一 个 简单 的 lambda 有 函数 来 等 待 std::condition_variable (JL 
4.1.1 节 ) 中 的 标志 被 设置 。 


清单 A.4 lambda Až H SRK 


std::condition_variable cond; 

bool data_ready; 

std::mutex m; 

void wait_for_data() 

{ 
std::unique_lock<std::mutex> 1k(m); 
cond.wait(1lk,[]{return data_ready;}); // 1 


lambda 的 返回 值 传 递 给 cond.wait()@， 函 数 就 能 推断 出 data_ready 的 类 型 是 bool。 当 条 件 变 
量 从 等 待 中 苏醒 后 ， 上 和 锁 阶段 会 调用 lambda 骂 数 ， 并 且 当 data_ready 为 true 时 ， 仅 返回 到 
wait() 中 。 


当 lambda 元 数 体 中 有 多 个 return 语 句 ， 就 需要 显 式 的 指定 返回 类 型 。 只 有 一 个 返回 语句 的 时 

候 ， 也 可 以 这 样 做 ， 不 过 这 样 可 能 会 让 你 的 lambda 函 数 体 看 起 来 更 复杂 。 返 回 类 型 可 以 使 用 
跟 在 参数 列表 后 面 的 箭头 (->) 进 行 设置 。 如 果 lambda 有 函数 没有 任何 参数 ， 还 需要 包含 ( 空 ) 的 参 
数列 表 ， 这 样 做 是 为 了 能 显 式 的 对 返回 类 型 进行 指定 。 对 条 件 变 量 的 预测 可 以 写成 下 面 这 种 

方式 : 


cond.wait(1lk,[]()->bool{return data_ready;}); 


还 可 以 对 lambda 函 数 进行 扩展 ， 比 如 : 加 上 log 信 息 的 打印 ， 或 做 更 加 复杂 的 操作 : 


cond.wait(l1k,[]()->bool{ 
if (data_ready) 
{ 
std: :cout<<”Data ready”<<std::endl; 
return true; 
} 
else 
{ 
std::cout<<”Data not ready, resuming wait”<<std::endl; 
return false; 
} 
D 


& 2K 8 % lambda HARIK > AALS REHAB g K eA A Tat A A SO 
获 。 


A.5.1 引用 本 地 变量 的 Lambda 马 数 


lambda 有 函数 使 用 空 的 [] (lambda introducen) 就 不 能 引用 当前 范围 内 的 本 地 变量 ; 其 只 能 使 用 
全 局 变量 ， 或 将 其 他 值 以 参数 的 形式 进行 传递 。 想 要 访问 一 个 本 地 变量 ， 其 进行 捕 
获 。 最 简单 的 方式 就 是 将 范围 内 的 所 有 本 地 变量 ne ， 使 用 [=] 就 可 以 完成 这 


能 。 函 数 被 创建 的 时 候 ， 就 能 对 本 地 变 men ij 访问 了 。 
实践 一 下 ， 看 一 下 下 面 的 例子 


std::function<int(int)> make_offseter(int offset) 
{ 
return [=](int j){return offset+j;}; 


当 调 用 make_offseter 时 ， 就 会 通过 std:: functions 函数 包装 返回 一 个 新 的 lambda 函 数 体 。 


这 个 带 有 返回 的 函数 添加 了 对 参数 的 偏 移 功能 。 例 如 : 


int main() 

{ 
std::function<int(int)> offset_42=make_offseter (42); 
std::function<int(int)> offset_123=make_offseter(123); 
std: :cout<<offset_42(12)<<”, “<<offset_123(12)<<std::end1; 
std: :cout<<offset_42(12)<<”, “<<offset_123(12)<<std::end1; 


屏幕 上 将 打印 出 54,135 两 次 ， 因 为 第 一 次 从 make_offseter 中 返回 ， 都 是 对 参数 加 42 的 ; 第 二 
次 调用 后 ，make_offseter 会 对 参数 加 上 123。 所 以 ， 会 打印 两 次 相同 的 值 。 


这 种 本 地 变量 捕获 的 方式 相当 安全 ， 所 有 的 东西 都 进 > PEVA T VA Ñ it lambda & ae Ht 


表达 式 的 值 进 行 返回 ae 行 调用 。 这 也 不 是 唯一 的 选择 ， 
也 可 以 通过 选择 通过 引用 的 方式 捕获 本 地 变量 。 在 本 地 变 oe 受 的 时 候 ，lambda 有 函数 会 出 
现 未 定义 的 行为 。 


下 面 的 例子 ， 就 介绍 一 下 怎么 使 用 [a] 对 所 有 本 地 变量 进行 引用 : 


int main( ) 
{ 

int offset=42; // 1 

std::function<int(int)> offset_a=[&](int j){return offset+j;}; 
// 2 

offset=123; // 3 

std::function<int(int)> offset_b=[&](int j){return offset+j;}; 
// 4 

std::cout<<offset_a(12)<<”,”<<offset_b(12)<<std::endl; // 5 

offset=99; // 6 

std: :cout<<offset_a(12)<<”,"<<offset_b(12)<<std::endl; // 7 


ee ee ee 
offset 的 引用 的 例子 @。 所 以 ，offset 初 始 化 成 42 也 没什么 关系 @ ; offset al(12) 的 例子 通常 
依赖 与 当前 offset 的 值 。 在 四 上 ，offset 的 值 会 变 为 123，offset _b@ 函 数 将 会 使 用 到 这 
样 第 二 个 函数 也 是 使 用 引用 的 方式 。 


现在 ， 第 一 行 打印 信息 回 ，offset 为 123， 所 以 输出 为 135,135。 不 过 ， 第 二 行 打印 信息 加 就 有 
所 不 同 ，offset 变 成 99@6， 所 以 输出 为 111,111。offset a 和 offset_b 都 对 当前 值 进行 了 加 12 的 操 
作 。 


尘 归 尘 ， aia > C++ 还 是 CH : o 到 特别 困惑 ， 你 可 以 选择 以 引用 或 
拷贝 的 方式 对 变量 进行 捕获 ， 并 且 — 可 以 na Nice 来 对 特定 的 变量 进 
行 显 式 捕获 。 parry 所 有 变量 ， 可 以 使 用 [=] ， 通 过 参考 中 括号 中 的 符 
号 ， 对 变量 进行 捕获 。 下 面 的 例子 将 会 打印 出 1239， 因 为 | 是 拷贝 3 pene 而 j 和 kK 
是 通过 引用 的 方式 进行 捕获 的 : 


int main() 

{ 
int i=1234, j=5678, k=9; 
std::function<int()> f=[=,&j,&k]{return i+j+k;}; 
i=1; 


std: :cout<<f()<<std::end1; 


或 者 ， 也 可 以 通过 默认 引用 方式 对 一 些 变量 做 引用 ， E al a aaa ald 
况 下 ， 就 要 使 用 [ay 0 竺 号 相 结 合 的 方式 对 列表 中 的 变量 进行 拷贝 捕获 。 下 面 的 例子 将 
打印 出 5688， 因 为 i 通过 引用 捕获 ， 但 j 和 Kk 通过 拷贝 捕获 : 


int main() 
{ 
int i=1234, j=5678, k=9; 


std::function<int()> f=[&,j,k]{return i+j+k;}; 
i=1; 


std: :cout<<f()<<std::end1; 


如 果 你 只 想 捕获 某 些 变量 ， 那 么 你 可 以 忽略 = 或 &， 仅 使 用 变量 名 进行 捕获 就 行 ; 加 上 & 前 级 ， 


是 将 对 应 变量 以 引用 的 方式 进行 捕获 ， 而 非 拷 贝 的 方式 。 下 面 的 例子 将 打印 出 5682， 因 为 i 和 
Kk 是 通过 引用 的 范式 获取 的 ， 而 j 是 通过 拷贝 的 方式 : 


int main() 
{ 
int i=1234, j=5678, k=9; 


std::function<int()> f=[&i,j,&k]{return i+j+k;}; 
i=1; 


std: :cout<<f()<<std::end1; 


最 后 一 种 方式 ， 是 为 了 确保 预期 的 变量 能 被 捕获 ， 在 捕获 列表 中 引 bea: 量 都 会 
引起 编译 错误 。 当 选择 这 种 方式 ， ve 心 类 成 员 的 访问 方式 ， 确 定 类 中 是 否 包 含 一 个 
lambda Waka Ri Reo KREG KA ARR > wR een 
员 ， 需 要 在 捕获 列表 中 添加 this 指 ， 以 便 捕获 。 下 面 的 例子 中 ，lambda 捕 获 this 后 ， 就 能 访 
问 到 some_data 类 中 的 成 员 : 


struct X 
{ 
int some_data; 
void foo(std::vector<int>& vec) 
{ 
std::for_each(vec.begin(),vec.end(), 
[this](int& 1){i+=some_data;}); 


} 
】 


并 发 的 上 下 文中 ，lambda 是 很 有 用 的 ， 其 可 以 作为 谓词 放 

在 std: :condition variable: :wait() ( 见 4.1.1 节 ) 和 std: :packaged_task<> ( 见 4.2.1 节 ) 中 3 或 是 
用 在 线程 池 中 ， 对 小 任务 进行 打包 。 也 可 以 线程 函数 的 方式 std::thread 的 构造 函数 ( 见 
2.1.1)， 以 及 作为 一 个 并 行 算法 实现 ， 在 parallel for each()( 见 8.5.1 节 ) 中 使 用 。 


A.6 变 参 模板 


aS SRE : 就 是 可 以 使 用 不 定数 量 的 参数 进行 特 化 的 模板 。 就 像 你 接触 到 的 变 参 函数 一 样 ， 
printf 就 接受 可 变 参数 。 现 在 ， 就 可 以 给 你 的 模板 指定 不 定数 量 的 参数 了 。 变 参 模板 在 整 

个 ct+ 线程 库 中 都 有 使 用 ， 例 如 : std::thread 的 构造 函数 就 是 一 个 变 参 类 模板 。 从 使 用 者 
的 角度 看 ， 仅 知道 模板 可 以 接受 无 限 个 参数 就 够 了 ， 不 过 当 要 写 这 么 一 个 模板 或 对 其 工作 原 
理 很 感 兴趣 时 ， 就 需要 了 解 一 些 细 节 o 


和 变 参 函数 一 样 ， 变 参 部 分 可 以 在 参数 列表 章 使 用 省 略 号 ... 代表 ， 变 参 模板 需要 在 参数 列 
表 中 使 用 省 略 号 : 


template<typename ... ParameterPack> 
class my_template 


{}; 


即使 主 模板 不 是 变 参 模板 ， 模 板 进 行 部 分 特 化 的 类 中 ， 也 可 以 使 用 可 变 参 数 模板 。 例 
he > std: :packaged_task<> ( 见 4.2.1 节 ) 的 主 模板 就 是 一 个 简单 的 模板 ， 这 个 简单 的 模板 只 有 一 
个 参数 : 


template<typename FunctionType> 
class packaged_task; 


， 并 不 是 所 有 地 方 都 这 样 定 义 ; 对 于 部 分 特 化 模板 来 说 ， 其 就 像 是 一 个 “ 占 位 符 ”: 


template<typename ReturnType, typename ... Args> 
class packaged_task<ReturnType(Args...)>; 


部 分 特 化 的 类 就 包含 实际 定义 的 类 ; 在 第 4 章 ， 可 以 写 一 
个 std: :packaged_ TORSE :string, double)> 来 声明 一 个 以 std: :String 和 double 作 为 参 
数 的 任务 ， 当 执行 这 个 任务 后 结果 会 由 std::future<int> 进行 保存 。 


声明 展示 了 两 个 变 参 模板 的 附加 特性 。 第 一 个 比较 简单 : 普通 模板 参数 (例如 ReturnType) 和 可 
变 模 板 参 数 (Args) 可 以 同时 声明 。 第 二 个 特性 ， 展 示 了 args... 特 化 类 的 模板 参数 列表 中 如 何 
使 用 ， 为 了 展示 实例 化 模板 中 的 Args 的 组 成 类 型 。 实 际 上 ， BLA RAMPA? 所 以 其 作为 
一 种 模式 进行 匹配 ; 在 列表 中 出 现 的 类 型 (被 Args 捕 获 ) 都 会 进行 实例 化 。 参 数 包 (parameter 
pack) 调 用 可 变 参 数 Args， 并 且 使 用 Args... 作为 包 的 扩展 。 


和 可 变 参 函数 一 样 ， 变 参 部 分 可 能 什么 都 没有 ， 也 可 能 有 很 多 类 型 项 。 例 

如 ， std::packaged_task<my_class()> 中 ReturnType 参 数 就 是 my_class， 并 且 Args 参 数 包 是 空 
的 ， 不 过 std: :packaged_task<void(int, double, my_class&, std: :string* )> 中 2 ReturnType 为 
void， 并 且 Args 列 表 中 的 类 型 就 有 : int, double, my_class& 和 std::string* ° 


A.6.1 扩展 参数 包 


变 参 模板 主要 依靠 包括 扩展 功能 ， 因 为 不 能 限制 有 更 多 的 类 型 添加 到 模板 参数 中 。 首 先 ， 列 
表 中 的 参数 类 型 使 用 到 的 时 候 ， 可 以 使 用 包 扩 展 ， 比 如 : 需要 给 其 他 模板 提供 类 型 参数 。 


template<typename ... Params> 
struct dummy 
{ 

std::tuple<Params...> data; 
}; 


成 员 变 量 data 是 一 个 std::tuple<> 实例 ， 包 含 所 有 指定 类 型 ， 所 以 dummy 的 成 员 变量 就 


为 std::tuple<int, double, char> ° 


可 以 将 包 扩展 和 普通 类 型 相 结合 : 


template<typename ... Params> 
struct dummy2 
{ 
std::tuple<std::string,Params...> data; 
}; 


这 次 ， 元 组 中 添加 了 额外 的 (第 一 个 ) 成 员 类 型 std::string 。 其 优雅 指出 在 于 ， 可 以 通过 包 扩 
展 的 方式 创建 一 种 模式 ， 这 种 模式 会 在 之 后 将 每 个 元 素描 贝 到 扩展 之 中 ， 可 以 使 用 ... RR 
示 扩 展 模式 的 结束 。 


例如 ， 创 建 使 用 参数 包 来 创建 元 组 中 所 有 的 元 素 ， 不 如 在 元 组 中 创建 指针 ， 或 使 
用 std::unique_ptr<> 指针 ， 指向 对 应 元 素 : 


template<typename ... Params> 

struct dummy3 

{ 
std::tuple<Params* ...> pointers; 
std::tuple<std::unique_ptr<Params> ...> unique_pointers; 


Y 


类 型 表达 式 会 比较 复杂 ， 提 供 的 参数 包 是 在 类 型 表达 式 中 产生 ， 并 且 表 达 式 中 使 用 ... 作为 
扩展 。 当 参数 包 已 经 扩展 ， 包 中 的 每 一 项 都 会 代替 对 应 的 类 型 表达 式 ， 在 结果 列表 中 产生 相 
应 的 数据 项 。 因 此 ， 当 参数 包 Params 包 含 int，int，char 类 型 ， 那 

A std: :tuple<std: :pair<std::unique_ptr<Params>,double> ... > 将 扩展 

为 std: :tuple<std: :pair<std: :unique_ptr<int>,double> , std::pair<std: :unique_ptr<int>, doubl 
e> , std: :pair<std::unique_ptr<char>, double> > ° to 包 扩 展 被 当做 模板 参数 列表 使 用 > AR 
么 模板 就 不 需要 变 长 的 参数 了 ; 如 果 不 需要 了 ， 参 数 包 就 要 对 模板 参数 的 要 求 进 行 准确 的 匹 
配 : 


template<typename ... Types> 
struct dummy4 
{ 

std::pair<Types...> data; 
}; 


dummy4<int,char> a; // 1 ok’ Astd::pair<int, char> 
dummy4<int> b; // 2 错误 ， 无 第 二 个 类 型 
dummy4<int,int,int> c; // 3 错误 ， 类 型 太 多 


可 以 使 用 包 扩 展 的 方式 ， 对 函数 的 参数 进行 声明 : 


template<typename ... Args> 
void foo(Args ... args); 


这 将 会 创建 一 个 新 参数 包 args， 其 是 一 组 函数 参数 ， 而 非 一 组 类 型 ， 并 且 这 里 ... 也 能 像 之 
前 一 样 进 行 扩 展 & 例如 可 以 在 std::thread 的 构造 函数 中 使 用 2 使 用 右 值 引用 的 方式 获取 郊 
数 所 有 的 参数 ( 见 A.1 节 ) : 


template<typename CallableType, typename ... Args> 
thread: : thread(CallableType&& func,Args&& ... args); 


函数 参数 包 也 可 以 用 来 调用 其 他 函数 ， 将 制定 包 扩 展 成 参数 列表 ， 匹 配 调用 的 函数 。 如 同类 
型 扩展 一 样 ， 也 可 以 使 用 某 种 模式 对 参数 列表 进行 扩展 。 


例如 ， 使 用 std::forward() 以 右 值 引用 的 方式 来 保存 提供 给 函数 的 参数 : 


template<typename ... ArgTypes> 
void bar(ArgTypes&& ... args) 
{ 


foo(std::forward<ArgTypes>(args)...); 


注意 一 下 这 个 例子 ， 包 扩展 包括 对 类 型 包 ArgTypes 和 函数 参数 包 args 的 扩展 ， 并 且 省 略 了 其 
余 的 表达 式 。 


当 这 样 调 用 bar 有 函数 : 


int i; 
bar(i,3.141,std::string("hello ")); 


将 会 扩展 为 


template<> 

void bar<int&, double, std: :string>( 
int& args 1, 
double&& args_2, 
std: :string&& args_ 3) 


{ 
foo(std::forward<int&>(args_1), 
std::forward<double>(args 2), 
std::forward<std::string>(args_3)); 
} 


这 样 就 将 第 一 个 参数 以 左 值 引用 的 形式 ， 正 确 的 传递 给 了 foo 函 数 ， 其 他 两 个 函数 都 是 以 右 值 
引用 的 方式 传 入 的 。 


最 后 一 件 事 ， 参 数 包 中 使 用 sizeof... 操作 可 以 获取 类 型 参数 类 型 的 大 小 >? sizeof...(p) 就 
是 p 参 数 包 中 所 包含 元 素 的 个 数 。 不 管 是 类 型 参数 包 或 函数 参数 包 ， 结 果 都 是 一 样 的 。 这 可 能 
是 唯一 一 次 在 使 用 参数 包 的 时 候 ， 没 有 加 省 略 号 ; 这 里 的 省 略 号 是 作为 sizeof... 操作 的 一 

部 分 ， 所 以 不 蓝 是 用 到 省 略 号 。 


下 面 的 函数 会 返回 参数 的 数量 : 


template<typename ... Args> 
unsigned count_args(Args 


{ 


return sizeof... (Args); 


就 像 善 通 的 sizeof 操 作 一样 ， sizeof... 
等 等 。 


args) 


的 结果 为 常 


E 


里 


表达 式 ， 所 以 其 可 以 用 来 于 


wi > 


ARA 


义 数 组 


A.7 目 动 推导 变量 类 型 


c 是 静态 语言 : 所 有 变量 的 类 型 ， 都 会 在 编译 时 被 准确 指定 。 所 以 ， 作 为 程序 员 你 需要 为 
每 个 变量 指定 对 应 的 类 型 。 


有 些 时 候 就 需要 使 用 一 些 繁琐 类 型 定义 ， 比 如 : 


std: :map<std::string, std: :unique_ptr<some_data>> m; 
std: :map<std::string, std: :unique_ptr<some_data>>::iterator 
iter=m.find("my key"); 


常规 的 解决 办 法 是 使 用 typedef 来 缩短 类 型 名 的 长 度 。 这 种 方式 在 c++ 11 中 仍然 可 行 ， 不 过 这 
里 要 介绍 一 种 新 的 解决 办 法 : 如 果 一 个 变量 需要 通过 一 个 已 初始 化 的 变量 类 型 来 为 其 做 声 
明 ， 那 么 就 可 以 直接 使 用 auto 关键 字 。 这 样 ， 编 译 器 就 会 通过 已 初始 化 的 变量 ， 去 自动 推断 


变量 的 类 型 。 


auto iter=m.find("my key"); 


当然 ， auto 还 有 很 多 种 用 法 : 可 以 使 用 它 来 声明 const、 指 针 或 引用 变量 。 这 里 使 用 auto 对 
相关 类 型 进行 了 声明 : 


auto i=42; // int 

auto& j=i; // int& 

auto const k=i; // int const 
auto* const p=&i; // int * const 


mr & 


变量 类 型 的 推导 规则 是 建立 一 些 语 言 规则 基础 上 : 函数 模板 参数 。 其 声明 形式 如 下 : 
some -type-expression-involving-auto var=some-expression; 


Var 变量 的 类 型 与 声明 函数 模板 的 参数 的 类 型 相同 。 要 想 替 换 auto ， 需 要 使 用 完整 的 类 型 参 
数 : 


template<typename T> 
void f(type-expression var); 
f(some-expression); 


在 使 用 auto 的 时 候 ， 数 组 类 型 将 衰变 为 指针 ， 引 用 将 会 被 删除 (除非 将 类 型 进行 显 式 为 引 
用 )， 比 如 : 


int some_array[45]; 

auto p=some_array; // int* 
int& r=*p; 

auto x=r; // int 

auto& y=r; // int& 


这 样 能 大 大 简化 变量 的 声明 过 程 ， 特 别 是 在 类 型 标识 符 特别 长 ， 或 不 清楚 具体 类 型 的 时 候 ( 例 
如 ， 调 用 函数 模板 ， 等 到 的 目标 值 类 型 就 是 不 确定 的 ) 。 


A.8 线程 本 地 变量 


线程 本 地 变量 允许 程序 中 的 每 个 线程 都 有 一 个 独立 的 实例 拷贝 。 可 以 使 用 thread local 关键 
字 来 对 这 样 的 变量 进行 声明 。 命 名 Re ERR 量 ， 以 及 本 地 变量 都 可 以 声明 
成 线程 本 地 变量 ， 为 了 在 线程 运行 前 对 这 些 数据 进行 存储 操作 : 


thread_local int x; // 命名 空间 内 的 线程 本 地 变量 


class X 
{ 
static thread_local std::string s; // 线程 本 地 的 静态 成 员 变量 
}; 
static thread local std::string X::s; // 这 里 需要 添加 X::S 


void foo() 


{ 
thread_local std::vector<int> v; // 一 般 线程 本 地 变量 


由 命名 空间 或 静态 数据 成 员 构成 的 线程 本 地 变量 ， 需 要 在 线程 单元 对 其 进行 使 用 前 进行 构 
建 。 有 些 实现 中 ， 会 将 对 线程 本 地 变量 的 初始 化 过 程 ， Re ; 还 有 一 些 可 能 会 在 


其 他 时 间 点 做 初始 化 ， 在 一 些 有 依赖 的 组 合 中 ， 根 据 具体 情 ee 天 定 。 将 没有 构造 好 的 
线程 本 地 变量 传递 给 线程 单元 使 用 ， 不 能 保证 它们 会 在 线程 中 进 ne 这 样 就 可 以 动态 加 
载 带 有 线程 本 地 变量 的 模块 一 变量 首先 需要 在 一 个 给 定 的 ww 直行 构造 ， 之 后 其 他 线程 


就 可 以 通过 动态 加 载 模块 对 线程 本 地 变量 进行 引用 。 


画 数 中 声明 的 线程 本 地 变量 ， 需 要 使 用 一 个 给 定 线程 进行 初始 化 (通过 第 一 波 控制 流 将 这 些 声 
明 传递 给 指定 线程 )。 如 果 函 数 没有 被 指定 线程 调用 ， 那 么 这 个 函数 中 声明 的 线程 本 地 变量 就 
不 会 构造 。 本 地 静态 变量 也 是 同样 的 情况 ， 除 非 其 单独 的 应 用 于 每 一 个 线程 。 


ee a A 一 步 的 初始 化 (比如 ， 动 态 初始 
化 ) ; 如 果 在 构造 线程 本 地 变量 时 抛 出 异常 ， srd: :terminate() 就 会 将 程序 终止 。 


析 构 函数 会 在 构造 线程 本 地 变量 的 那个 线程 返回 时 调用 ， 析 构 顺 序 是 构造 的 逆 顺 序 。 当 初始 
化 顺序 没有 指定 时 ， 确 定 析 构 防 数 和 这 些 变 量 是 否 有 相互 依存 关系 就 尤为 重要 了 。 当 线程 本 
地 变量 的 析 构 函数 抛 出 异常 时 ， std: :terminate() 会 被 调用 ， 将 程序 终止 。 


当 线 程 调用 std::exit() 或 从 main() 函 数 返 回 (等 价 于 调用 std::exit() 作为 main() 的 “返回 和 值 ”) 
时 ， 线 程 本 地 变量 也 会 为 了 这 个 线程 进行 销毁 。 应 用 退出 时 还 有 线程 在 运行 ， 对 于 这 些 线程 
来 说 ， 线 程 本 地 变量 的 析 构 函数 就 没有 被 调用 。 


虽然 ， 线 程 林地 变量 在 不 同 线程 上 有 不 同 的 地 址 ， 不 过 还 是 可 以 获取 指向 这 些 变量 的 一 般 指 
针 。 指 针 会 在 线程 中 ， 通 过 获取 地 址 的 方式 ， 引 用 相应 的 对 象 。 当 引用 被 销 角 的 对 象 时 ， 会 
出 现 未 定义 行为 ， 所 以 在 向 其 他 线程 传递 线程 本 地 变量 指针 时 ， 就 需要 保证 指向 对 象 所 在 的 
线程 结束 后 ， 不 能 对 相应 的 指针 进行 解 引用 。 


A.9 本 章 总 结 


本 附录 仅 是 摘录 了 部 分 C++ 11 标 准 的 新 特性 ， 因 为 这 些 特性 和 线程 库 之 间 有 着 良好 的 互动 。 
其 他 的 新 特性 ， 包 括 : 静态 断言 (Static_assert)， 强 类 型 枚 举 (enum class)， 委 托 构造 函数 ， 
Unicode 码 支持 ， 模 板 别名 ， 以 及 统一 的 初始 化 序列 。 对 于 新 功能 的 详细 描述 已 经 超出 了 本 书 
的 范围 ; 需要 另外 一 本 书 来 进行 详细 介绍 。 对 标准 改动 的 最 好 的 概述 可 能 就 是 由 Bjarne 
Stroustrup 编 写 的 《 c++ 11FAQ) [1], 其 他 c++ 的 参考 书籍 也 会 在 未 来 对 ct+ 11 标 准 进 行 覆 
žo 


希望 这 里 的 简短 介绍 ， 能 让 你 了 解 这些 新 功能 和 线程 库 之 间 的 关系 ， 并 且 在 写 多 线程 代码 的 
时 候 能 用 到 这 些 新 功能 。 虽 然 ， 本 附录 为 了 新 特性 提供 了 足够 简单 的 例子 ， 不 过 这 里 还 是 一 
个 简单 的 介绍 ， 并 非 新 功能 的 一 份 完 整 的 参考 或 教程 。 如 果 想 在 你 的 代码 中 大 量 使 用 这 些 新 
功能 ， 我 建议 去 找 相关 权威 的 参考 书 或 教程 ， 了 解 更 加 详细 的 情况 。 


【1】 http://www.research.att.com/~bs/C++0xFAQ.html 


附录 B 并 发 库 的 简单 比较 


虽然 ，C++11 才 开始 正式 支持 并 发 ， 不 过 ， 高 级 编程 语言 都 支持 并 发 和 多 线程 已 经 不 是 什么 新 
鲜 事 了 。 例 如 ，Java 在 第 一 个 发 布 版 本 中 就 支持 多 线程 编程 ， 在 某 些 平台 上 也 提供 符合 
POSIX C 标 准 的 多 线程 接口 ， 还 有 Erlang 支 持 消息 的 同步 传递 (有 点 类 似 于 MPI)。 当 然 还 有 使 


用 C++ 类 的 库 ， 比 如 Boost， 其 将 底层 多 线程 接口 进行 包装 
用 POSIX C 的 接口 ， 或 其 他 接口 )， 


其 对 支持 的 平台 会 提供 


可 


适用 于 任何 给 定 的 平台 (不 论 是 使 
移植 接口 。 


这 些 库 或 者 编程 语言 ， 已 经 写 了 很 多 多 线程 应 用 ， 并 且 在 使 用 这 些 库 写 多 线程 代码 的 经 验 ， 
可 以 借鉴 到 C++ 中 ， 本 附录 就 对 Java，POSIX C， 使 用 Boost 线 程 库 的 C++， 以 及 C++11 中 的 
多 线程 工具 进行 简单 的 比较 ， 当 然 也 会 交叉 引用 本 书 的 相关 章节 。 
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消息 传递 框架 与 完整 的 ATM 示 例 


ATM : 自动 取款 机 。 


1 回 到 第 4 章 ， 我 举 了 一 个 使 用 消息 传递 框架 在 线程 间 发 送信 息 的 例子 。 这 里 就 会 使 用 这 个 实 
现 来 完成 ATM 功 能 。 下 面 完 整 代码 就 是 功能 的 实现 ， 包 括 消 息 传 递 框 架 。 


清单 C.1 实 现 了 一 个 消息 队列 。 其 可 以 将 消息 以 指针 (指向 基 类 ) 的 方式 存储 在 列表 中 ; 指定 消 
息 类 型 会 由 基 类 派生 模板 进行 处 理 。 推 送 包装 类 的 构造 实例 ， 以 及 存储 指向 这 个 实例 的 指 

针 ; 弹出 实例 的 时 候 ， 将 会 返回 指向 其 的 指针 。 因 为 message_base 类 没有 任何 成 员 部 数 ， 在 
访问 存储 消息 之 前 ， 弹 出 线程 就 需要 将 指针 转 为 wrapped_message 指 针 。 


清单 C.1 简单 的 消息 队列 
#include <mutex> 
#include <condition variable> 


#include <queue> 
#include <memory> 


namespace messaging 


{ 
struct message_base // 队列 项 的 基础 类 
{ 
virtual ~message_base() 
{} 
J; 


template<typename Msg> 
struct wrapped_message: // 每 个 消息 类 型 都 需要 特 化 
message_base 


Msg contents; 


explicit wrapped_message(Msg const& contents_): 
contents(contents_) 
{} 
}; 


class queue // 我 们 的 队列 


std::mutex m; 
std::condition_variable cC; 
std: :queue<std::shared_ptr<message_base> > q; // 实际 存储 指向 
message_base 类 指针 的 队列 
public: 
template<typename T> 
void push(T const& msg) 
{ 
std::lock_guard<std: :mutex> lk(m); 
q.push(std: :make_shared<wrapped_message<T> >(msg)); // 
装 已 传递 的 信息 ， 存 储 指针 
c.notify_all(); 


cy 


} 

std::shared ptr<message base> wait_and_pop() 

{ 
std::unique_lock<std::mutex> lk(m); 
c.wait(1k,[&]{return !q.empty();}); // 当 队 列 为 空 时 阻塞 
auto res=q.front(); 
q.pop(); 
return res; 

} 

J; 


发 送 通过 sender 类 ( 见 清 单 C.2) 实 例 处 理 过 的 消息 。 只 能 对 已 推送 到 队列 中 的 消息 进行 包装 。 
对 sender 实 例 的 捞 贝 ， 只 是 捞 贝 了 指向 队列 的 指针 ， 而 非 队 列 本 身 。 


清单 C.2 sender 类 


namespace messaging 


{ 
class sender 
{ 
queue*q; // sender 是 一 个 队列 指针 的 包装 类 
public: 
sender(): // sender 无 队列 (默认 构造 函数 ) 
q(nullptr) 
{} 
explicit sender(queue*q_): // 从 指向 队列 的 指针 进行 构造 
q(q_) 
{} 
template<typename Message> 
void send(Message const& msg) 
{ 
if (q) 
{ 
q->push(msg); // 将 发 送信 息 推送 给 队列 
} 
} 
}; 
} 


接收 信息 部 分 有 些 麻烦 。 不 仅 要 等 待 队 列 中 的 消息 ， 还 要 检查 消息 类 型 是 否 与 所 等 待 的 消息 
类 型 匹配 ， 并 调用 处 理 函 数 进 行 处 理 。 那 么 就 从 receiver 类 的 实现 开始 吧 。 


清单 C.3 receiver 类 


namespace messaging 


{ 
class receiver 
{ 
queue q; // 接受 者 拥有 对 应 队列 
public: 
operator sender() // 允许 将 类 中 队列 隐 式 转化 为 一 个 sender 队 列 
{ 
return sender(&q); 
} 
dispatcher wait() // 等 待 对 队列 进行 调度 
{ 
return dispatcher(&q); 
} 
}; 
} 


sender 只 是 引用 一 个 消息 队列 ， 而 receiver 是 拥有 一 个 队列 。 可 以 使 用 隐 式 转换 的 方式 获取 
sender 引 用 的 类 。 难 点 在 于 wait() 中 的 调度 。 这 里 创建 了 一 个 dispatcher 对 象 引 用 receiver 中 的 
队列 。dispatcher 类 实现 会 在 下 一 个 清单 中 看 到 ; 如 你 所 见 ， 任 务 是 在 析 构 函数 中 完成 的 。 在 
这 个 例子 中 ， 所 要 做 的 工作 是 对 消息 进行 等 待 ， 以 及 对 其 进行 调度 。 


清单 C.4 dispatcher 类 


namespace messaging 


{ 
class close_queue // 用 于 关闭 队列 的 消息 


th; 


class dispatcher 


{ 
queue* q; 
bool chained; 


dispatcher (dispatcher const&)=delete; // dispatcher 实 例 不 能 被 
拷贝 


dispatcher& operator=(dispatcher const&)=delete; 


template< 
typename Dispatcher, 


typename Msg, 
typename Func> // 允许 TemplateDispatcher 实 例 访问 内 部 成 员 
friend class TemplateDispatcher; 


void wait_and_dispatch() 
{ 
for(;;) // 1 循环 ， 等 待 调度 消息 
{ 
auto msg=q->wait_and_pop(); 
dispatch(msg); 


bool dispatch( // 2 dispatch() 会 检查 close_queue 消 息 ， 然 后 抛 出 
std::shared_ptr<message_base> const& msg) 


if (dynamic_cast<wrapped_message<close_ queue>*>(msg.get())) 
{ 


throw close_queue(); 


} 


return false; 
} 
public: 
dispatcher(dispatcher&& other): // dispatcher 实 例 可 以 移动 
q(other.q),chained(other.chained) 


other.chained=true; // 源 不 能 等 待 消息 


explicit dispatcher(queue* q_): 
q(q_), chained( false) 
{} 


template<typename Message,typename Func> 
TemplateDispatcher<dispatcher,Message,Func> 
handle(Func&& f) // 3 使 用 TemplateDispatcher 处 理 指 定 类 型 的 消息 
{ 
return TemplateDispatcher<dispatcher,Message,Func>( 
q, this, std: : forward<Func>(f)); 


~dispatcher() noexcept(false) // 4 析 构 函数 可 能 会 抛 出 异常 
{ 

if(!chained) 

{ 


wait_and_dispatch(); 


了 


从 wait() 返 回 的 dispatcher 实 例 将 马上 被 销毁 ， 因 为 是 临时 变量 ， 也 向 前 文 提 到 的 ， 析 构 函 数 
E ERRE KG LE o Pr AAA Al wait_and_dispatch() Rž > & + HAP A—-MARO > F 
45 TH RADE A (RAE A ART IE ARTE) > RUG AS RS 38 Adispatch() Až © dispatch() HAA 
身 @ 很 简单 ; 会 检查 小 时 是 否 是 一 个 close queue} &° 4 close _ queue 消息 时 ， 抛 出 一 个 
异常 ; 如 果 不 是 ， 函 数 将 会 返回 false 来 表明 消息 没有 被 处 理 。 因 为 会 抛 出 close _queue 异 常 ， 
所 以 析 构 函数 会 标示 为 noexcept(false) ; 在 没有 任何 标识 的 情况 下 ， 一 般 情 况 下 析 构 函数 
都 noexcept(true) @ 型 ， 这 表示 没有 任何 异常 抛 出 ， 并 且 close _ queue 异常 将 会 使 程序 终止 。 


虽然 ， 不 会 经 常 的 去 调用 wait() 函 数 ， 不 过 ， 在 大 多 数 时 间 里 ， 你 都 希望 对 一 条 消息 进行 处 

理 。 这 时 就 需要 handle() 成 员 函 数 回 的 加 入 。 这 个 函数 是 一 个 模板 ， 并 且 消息 类 型 不 可 推断 ， 
所 以 你 需要 指定 需要 处 理 的 消息 类 型 ， 并 且 传 入 函数 (或 可 调用 对 象 ) 进 行 处 理 ， 并 将 队列 传 入 
当前 dispatcher 对 象 的 handle() 骂 数 。 这 将 在 清单 C.5 中 展示 。 这 就 是 为 什么 ， 在 测试 析 构 函数 
中 的 chained 值 前 ， 要 等 待 消息 耳 采 原因 ; 不 仅 是 避免 “移动 类 型 的 对 象 对 消息 进行 等 待 ， 而 
且 人 允许 将 等 待 状态 转移 到 新 的 TemplateDispatcher 实 例 中 。 


清单 C.5 TemplateDispatcher 类 模板 


namespace messaging 
{ 
template<typename PreviousDispatcher, typename Msg, typename 
Func> 
class TemplateDispatcher 
{ 
queue* q; 
PreviousDispatcher* prev; 
Func f; 
bool chained; 


TemplateDispatcher(TemplateDispatcher const&)=delete; 
TemplateDispatcher& operator=(TemplateDispatcher 


const&)=delete; 


template<typename Dispatcher, typename OtherMsg, typename 
OtherFunc> 

friend class TemplateDispatcher; // 所 有 特 化 的 
TemplateDispatcher 类 型 实例 都 是 友 元 类 


void wait_and_dispatch() 


{ 
for(;;) 
{ 
auto msg=q->wait_and_pop()j; 
if(dispatch(msg)) // 1 如 果 消 息 处 理 过 后 ， 会 跳出 循环 
break; 
} 
} 


bool dispatch(std::shared_ptr<message_base> const& msg) 
{ 
if (wrapped_message<Msg>* wrapper= 
dynamic_cast<wrapped_message<Msg>*>(msg.get())) // 2 检 
查 消息 类 型 ， 并 且 调 用 函数 
{ 
f(wrapper->contents); 
return true; 


} 
else 
{ 
return prev->dispatch(msg); // 3 链接 到 之 前 的 调度 器 上 
} 
} 
public: 


TemplateDispatcher(TemplateDispatcher&& other): 
q(other.q),prev(other.prev),f(std::move(other.f)), 
chained(other .chained) 


other .chained=true; 
} 
TemplateDispatcher(queue* q_,PreviousDispatcher* 
prev_,Func&& f_): 


q(q_),prev(prev_), f(std: : forward<Func> 
(f_)),chained(false) 
{ 


prev_->chained=true; 


template<typename OtherMsg, typename OtherFunc> 
TemplateDispatcher<TemplateDispatcher, OtherMsg, OtherFunc> 
handle(OtherFunc&& of) // 4 可 以 链接 其 他 处 理 器 


{ 
return TemplateDispatcher< 
TemplateDispatcher, OtherMsg, OtherFunc>( 
q, this, std: : forward<OtherFunc>(of)); 
} 


~TemplateDispatcher() noexcept(false) // 5 这 个 析 构 函数 也 是 
noexcept(false) 的 
{ 
if(!chained) 
{ 


wait_and_dispatch(); 


i; 


TemplateDispatcher<> 类 模板 仿照 了 dispatcher 类 ， 二 者 几乎 相同 。 特 别 是 在 析 构 函数 上 ， 都 
是 调用 wait_ and _dispatch() 等 待 处 理 消息 。 


在 处 理 消息 的 过 程 中 ， 如 果 不 抛 出 异常 ， 就 需要 检查 一 下 在 循环 中 国 ， 消 息 是 否 已 经 得 到 了 处 
理 。 当 成 功 的 处 理 了 一 条 消息 ， 处 理 过 程 就 可 以 停止 ， 这 样 就 可 以 等 待 下 一 组 消息 的 传 入 

了 。 当 获取 了 一 个 和 指定 类 型 匹配 的 消息 ， 使 用 函数 调用 的 方式 @@， 就 要 好 于 抛 出 异常 ( 虽 
然 ， 处 理 函 数 也 可 能 会 抛 出 异常 )。 如 果 消 息 类 型 不 匹配 ， 那 么 就 可 以 链接 前 一 个 调度 器 四 © 
在 第 一 个 实例 中 ，dispatcher 实 例 确实 作为 一 个 调度 器 ， 当 在 handle()@ 函 数 中 进行 链接 后 ， 
就 允许 处 理 多 种 类 型 的 消息 。 在 链接 了 之 前 的 TemplateDispatcher<> 实 例 后 ， 当 消息 类 型 和 
当前 的 调度 器 类 型 不 匹配 的 时 候 ， 调 度 链 会 依次 的 向 前 寻找 类 型 匹配 的 调度 器 。 因 为 任何 调 
度 器 都 可 能 抛 出 异常 (包括 dispatcher 中 对 close queue 消 息 进 行 处 理 的 默认 处 理 器 )， 析 构 函 
数 在 这 里 会 再 次 被 声明 为 noexcept(false) © ° 


这 种 简单 的 架构 允许 你 想 队 列 推送 任何 类 型 的 消息 ， 并 且 调度 器 有 选择 的 与 接收 端的 消息 进 
行 匹 配 。 同 样 ， 也 允许 为 了 推送 消息 ， 将 消息 队列 的 引用 进行 传递 的 同时 ， 保 持 接 收 端的 私 
有 性 。 


为 了 完成 第 4 章 的 例子 ， 消 息 的 组 成 将 在 清单 C.6 中 给 出 ， 各 种 状态 机 将 在 清单 C.7,C.8 和 C.9 
中 给 出 。 最 后 ， 驱 动 代 码 将 在 C.10 给 出 。 


清单 C.6 ATM 消 息 


struct withdraw 
{ 
std::string account; 
unsigned amount; 
mutable messaging::sender atm_queue; 


withdraw(std::string const& account_, 
unsigned amount_, 
messaging::sender atm_queue_): 
account (account_),amount(amount_), 
atm_queue(atm_queue_) 
{} 
J; 


struct withdraw_ok 


{}; 


struct withdraw denied 


{}; 


struct cancel withdrawal 
{ 
std::string account; 
unsigned amount; 
cancel_withdrawal(std::string const& account_, 
unsigned amount_): 
account (account_), amount (amount_) 
{} 
}; 


struct withdrawal processed 


{ 


std::string account; 
unsigned amount; 
withdrawal_processed(std::string const& account_, 
unsigned amount_): 
account (account_), amount (amount_) 
{} 
}; 


struct card_inserted 
{ 
std::string account; 
explicit card_inserted(std::string const& account_): 
account (account_) 
{} 
}; 


struct digit_pressed 
{ 
char digit; 
explicit digit_pressed(char digit_): 
digit(digit_) 
{} 
}; 


struct clear_last_pressed 


{}; 


struct eject_card 


{}; 


struct withdraw_pressed 
{ 
unsigned amount; 
explicit withdraw_pressed(unsigned amount_): 
amount (amount_) 
{} 
}; 


struct cancel pressed 


{}; 


struct issue_money 


{ 


unsigned amount; 
issue_money(unsigned amount_): 
amount (amount_) 
{} 
}; 


struct verify_pin 


{ 


std::string account; 
std::string pin; 
mutable messaging: :sender atm_queue; 


verify_pin(std::string const& account_, std::string const& 
pin_, 
messaging::sender atm_queue_): 
account (account_),pin(pin_),atm_queue(atm_queue_) 
{} 
}; 


struct pin_verified 


{}; 


struct pin_incorrect 


{}; 


struct display_enter_pin 


i}; 


struct display_enter_card 


Caer 


struct display_insufficient_funds 


{ 


struct display_withdrawal_cancelled 


{}; 


struct display_pin_incorrect_message 


{}; 


struct display withdrawal options 


{}; 


struct get_balance 
{ 
std::string account; 
mutable messaging::sender atm_queue; 


get_balance(std::string const& account_, messaging: :sender 
atm_queue_): 
account (account_),atm_queue(atm_queue_) 
{} 
}; 


struct balance 
{ 
unsigned amount; 
explicit balance(unsigned amount_): 
amount (amount_) 
{} 
J; 


struct display_balance 


{ 


unsigned amount; 
explicit display_balance(unsigned amount_): 
amount (amount_) 


{} 
Ja 


struct balance_pressed 


{}; 


清单 C.7 ATM 状 态 机 


class atm 


{ 


messaging: :receliver incoming; 
messaging::sender bank; 
messaging::sender interface_hardware; 


void (atm::*state)(); 


std::string account; 
unsigned withdrawal_amount; 
std::string pin; 


void process_withdrawal() 
x 
incoming.wait() 
.handle<withdraw_ok>( 
[&](withdraw_ok const& msg) 
{ 
interface_hardware.send( 
issue_money(withdrawal_amount ) ); 


bank.send( 
withdrawal_processed(account,withdrawal_amount) ); 


state=&atm: :done_processing; 
}) 
.handle<withdraw_denied>( 
[&](withdraw_denied const& msg) 
{ 


interface_hardware.send(display_insufficient_funds()); 


state=&atm: :done_processing; 
}) 
.handle<cancel_pressed>( 
[&](cancel_pressed const& msg) 
{ 
bank.send( 
cancel_withdrawal(account,withdrawal_amount) ); 


interface_hardware.send( 
display_withdrawal_cancelled()); 


state=&atm: :done_processing; 


}); 


void process_balance() 
{ 
incoming.wait() 
.handle<balance>( 
[&](balance const& msg) 
{ 


interface_hardware.send(display_balance(msg.amount)); 


state=&atm: :wait_for_action; 
}) 
.handle<cancel_pressed>( 
[&](cancel_pressed const& msg) 


i 


state=&atm: :done_processing; 


}); 


void wait_for_action() 


{ 


inter face_hardware.send(display_withdrawal_options()); 


incoming.wait() 

.handle<withdraw_pressed>( 

[&](withdraw_pressed const& msg) 

{ 
withdrawal_amount=msg.amount; 
bank.send(withdraw(account,msg.amount, incoming)); 
state=&atm: :process_withdrawal; 

}) 

.handle<balance_pressed>( 

[&](balance_pressed const& msg) 

{ 
bank.send(get_balance(account, incoming) ); 
state=&atm: :process_balance; 


}) 


.handle<cancel_pressed>( 


[&](cancel_pressed const& msg) 
{ 


state=&atm: :done_processing; 


}); 


void verifying_pin() 
{ 
incoming.wait() 
.handle<pin_verified>( 
[&](pin_verified const& msg) 
{ 
state=&atm: :wait_for_action; 
}) 
.handle<pin_incorrect>( 
[&](pin_incorrect const& msg) 
{ 
interface_hardware.send( 
display_pin_incorrect_message()); 
state=&atm: :done_processing; 
}) 
.handle<cancel_pressed>( 
[&](cancel_pressed const& msg) 
{ 


state=&atm: :done_processing; 


}); 


void getting_pin() 
{ 
incoming.wait() 
.handle<digit_pressed>( 
[&](digit_pressed const& msg) 
{ 
unsigned const pin_length=4; 
pint=msg.digit; 


if (pin. length()==pin_length) 
{ 


bank.send(verify_pin(account, pin, incoming) ); 


state=&atm: :verifying_pin; 
} 
}) 
.handle<clear_last_pressed>( 
[&](clear_last_pressed const& msg) 
{ 
if(!pin.empty()) 
{ 
pin.pop_back(); 
} 
}) 


.handle<cancel_pressed>( 
[&](cancel_pressed const& msg) 
{ 

state=&atm: :done_processing; 


Pe 


void waiting_for_card() 


{ 


interface_hardware.send(display_enter_card()); 


incoming.wait() 

.handle<card_inserted>( 

[&](card_inserted const& msg) 

{ 
account=msg.account; 
pin=""; 
interface_hardware.send(display_enter_pin()); 
state=&atm: :getting_pin; 


D) 


void done_processing() 


{ 
interface_hardware.send(eject_card()); 
state=&atm: :waiting_for_card; 


atm(atm const&)=delete; 


atm& operator=(atm const&)=delete; 
public: 
atm(messaging::sender bank_, 
messaging: :sender interface_hardware_): 
bank(bank_),interface_hardware(interface_hardware_) 


{} 


void done() 


i 


get_sender().send(messaging: :close_queue()); 


void run() 
{ 
state=&atm: :waiting_for_card; 
try 
{ 
for(;;) 
{ 
(this->*state)(); 


} 


catch(messaging::close_queue const&) 
{ 
i 


messaging::sender get_sender() 


{ 


return incoming; 


} 
Ja 


清单 C.8 银行 状态 机 


class bank_machine 

{ 
messaging: :receiver incoming; 
unsigned balance; 

public: 


bank_machine(): 


balance(199) 
{} 


void done() 


{ 


get_sender().send(messaging: :close_queue()); 


void run() 
{ 
try 
{ 
for(;;) 
{ 
incoming.wait() 
.handle<verify_pin>( 
[&](verify_pin const& msg) 


{ 
if (msg.pin=="1937") 
{ 
msg.atm_queue.send(pin_verified()); 
} 
else 
{ 
msg.atm_queue.send(pin_incorrect()); 
} 
}) 
.handle<withdraw>( 
[&](withdraw const& msg) 
{ 


if (balance>=msg.amount ) 

{ 
msg.atm_queue.send(withdraw_ok()); 
balance-=msg.amount; 

} 


else 


{ 


msg.atm_queue.send(withdraw_denied()); 


} 
}) 


.handle<get_balance>( 
[&](get_balance const& msg) 
{ 
msg.atm_queue.send(::balance(balance) ); 
}) 
.handle<withdrawal_processed>( 
[&](withdrawal_processed const& msg) 
{ 
}) 


.handle<cancel_withdrawal>( 
[&](cancel_withdrawal const& msg) 
{ 

}); 


} 


catch(messaging::close_queue const&) 
{ 
} 


messaging: :sender get_sender() 


i 


return incoming; 


} 
}; 


清单 C.9 用 户 状 态 机 


class interface machine 


{ 

messaging::receiver incoming; 
public: 

void done() 


{ 


get_sender().send(messaging: :close_queue()); 


void run() 


try 
{ 
for(;;) 
{ 
incoming.wait() 
.handle<issue_money>( 
[&](issue_money const& msg) 


{ 
{ 
std::lock_guard<std::mutex> 1k(iom); 
std::cout<<"Issuing " 
<<msg.amount<<std::end1; 
} 
}) 


.handle<display_insufficient_funds>( 
[&](display_insufficient_funds const& msg) 
{ 


std::lock_guard<std::mutex> 1k(iom); 
std::cout<<"Insufficient funds"<<std::endl; 
} 
}) 
.handle<display_enter_pin>( 
[&](display_enter_pin const& msg) 
{ 


std::lock_guard<std::mutex> lk(iom); 
std::cout<<"Please enter your PIN (0-9)" 
<<std::endl; 
} 
}) 


.handle<display_enter_card>( 
[&](display_enter_card const& msg) 
{ 


std::lock_guard<std::mutex> 1k(iom); 
std::cout<<"Please enter your card (I)" 
<<std::endl; 


}) 


.handle<display_balance>( 
[&](display_balance const& msg) 


{ 
{ 
std::lock_guard<std::mutex> lk(iom); 
std::cout 
<<"The balance of your account is " 
<<msg.amount<<std::end1; 
} 
}) 


.handle<display_withdrawal_options>( 
[&](display_withdrawal_options const& msg) 
{ 


std::lock_guard<std::mutex> lk(iom); 
std::cout<<"Withdraw 50? (w)"<<std::endl; 
std::cout<<"Display Balance? (b)" 
<<std::endl; 
std::cout<<"Cancel? (c)"<<std::endl; 
} 
}) 


.handle<display_withdrawal_cancelled>( 
[&](display_withdrawal_cancelled const& msg) 


{ 


std::lock_guard<std::mutex> 1k(iom); 
std::cout<<"withdrawal cancelled" 
<<std::endl; 
} 
}) 
.handle<display_pin_incorrect_message>( 
[&](display_pin_incorrect_message const& msg) 


{ 


std::lock_guard<std::mutex> 1k(iom); 
std::cout<<"PIN incorrect"<<std::endl; 
} 
}) 


.handle<eject_card>( 


[&](eject_card const& msg) 
{ 


std::lock_guard<std::mutex> 1k(iom); 
std::cout<<"Ejecting card"<<std::endl; 


+); 


} 


catch(messaging: :close_queue&) 
{ 
} 


messaging: :sender get_sender() 


{ 


return incoming; 


} 
}; 


清单 C.10 驱动 代码 
int main() 
{ 
bank_machine bank; 


interface_machine interface_hardware; 


atm 
machine(bank.get_sender(), interface_hardware.get_sender()); 


std::thread bank_thread(&bank_machine: : run, &bank) ; 
std: : thread 
if_thread(&interface_machine: :run, &interface_hardware) ; 
std::thread atm_thread(&atm: :run, &machine); 
messaging::sender atmqueue(machine.get_sender()); 


bool quit_pressed=false; 


while(!quit_pressed) 


char c=getchar(); 


switch(c) 
{ 

case '0': 
case '1i': 
case '2': 
case '3': 
case '4': 
case '5': 
case '6': 
case '7': 
case '8': 
case '9': 


atmqueue.send(digit_pressed(c)); 
break; 

case 'b': 
atmqueue.send(balance_pressed()); 
break; 

case 'w': 
atmqueue.send(withdraw_pressed(50) ); 
break; 

case 'c': 
atmqueue.send(cancel_pressed()); 
break; 

case 'q': 
quit_pressed=true; 
break; 

case 'i': 

atmqueue.send(card_inserted("acc1234")); 

break; 


bank.done(); 
machine.done(); 
interface_hardware.done(); 


atm_thread.join(); 
bank_thread.join(); 


if_thread.join(); 


附录 D C++ 线程 库 参 考 


D.1 <chrono> 头 文件 


<Chrono> 头 文件 作为 time_point 的 提供 者 ， 具 有 代表 时 间 点 的 类 ，duration 类 和 时 钟 类 。 每 
个 时 钟 都 有 一 个 is_steady 静态 数据 成 员 ， 这 个 成 员 用 来 表示 该 时 钟 是 否 是 一 个 稳定 的 时 钟 
(以 匀速 计时 的 时 钟 ， 且 不 可 调节 )。 std::chrono::steady_clock 是 唯一 个 能 保证 稳定 的 时 钟 


类 o 


头 文件 正文 


namespace std 
{ 
namespace chrono 
{ 
template<typename Rep, typename Period = ratio<1>> 
class duration; 
template< 
typename Clock, 
typename Duration = typename Clock: :duration> 
class time_point; 
class system_clock; 
class steady_clock; 
typedef unspecified-clock-type high_resolution_clock; 


D.1.1 std::chrono::duration & # 72 74 


std::chrono::duration 类 模板 可 以 用 来 表示 时 间 。 模 板 参 数 Rep 和 period 是 用 来 存储 持续 
时 间 的 数据 类 型 std::ratio 实例 代表 了 时 间 的 长 度 ( 几 分 之 一 秒 )， 其 表示 了 在 两 次 “时 钟 滴 
答 " 后 的 时 间 ( 时 钟 周期 )。 因 此 ， std::chrono::duration<int, std::milli> 即 为 ， 时 间 以 毫秒 
数 的 形式 存储 到 int 类 型 中 ， 而 std::chrono: :duration<short, std::ratio<1,50>> 则 是 记录 1/50 
秒 的 个 数 ， 并 将 个 数 存 入 short 类 型 的 变量 中 ? 还 有 std::chrono::duration <long long, 
std::ratio<60,1>> 则 是 将 分 钟 数 存储 到 long long 类 型 的 变量 中 。 


类 的 定义 


template <class Rep, class Period=ratio<1> > 


class duration 


{ 


public: 


Pi 


typedef Rep rep; 
typedef Period period; 


constexpr duration() = default; 
~duration() = default; 


duration(const duration&) = default; 
duration& operator=(const duration&) = default; 


template <class Rep2> 
constexpr explicit duration(const Rep2& r); 


template <class Rep2, class Period2> 
constexpr duration(const duration<Rep2, Period2>& d); 


constexpr rep count() const; 
constexpr duration operator+() const; 
constexpr duration operator-() const; 


duration& operator++(); 
duration operator++(int); 
duration& operator--(); 
duration operator--(int); 


duration& operator+=(const duration& d); 
duration& operator-=(const duration& d); 
duration& operator*=(const rep& rhs); 
duration& operator/=(const rep& rhs); 


duration& operator%=(const rep& rhs); 
duration& operator%=(const duration& rhs); 


static constexpr duration zero(); 
static constexpr duration min(); 
static constexpr duration max(); 


template <class Rep1, class Periodi, class 
constexpr bool operator== 
const duration<Rep1, Periodi>& lhs, 
const duration<Rep2, Period2>& rhs); 


template <class Rep1, class Periodi, class 
constexpr bool operator!=( 
const duration<Rep1, Periodi>& lhs, 
const duration<Rep2, Period2>& rhs); 


template <class Rep1, class Periodi, class 
constexpr bool operator<( 
const duration<Rep1, Periodi>& lhs, 
const duration<Rep2, Period2>& rhs); 


template <class Repi, class Periodi, class 
constexpr bool operator<=( 
const duration<Rep1, Periodi>& lhs, 
const duration<Rep2, Period2>& rhs); 


template <class Rep1, class Periodi, class 
constexpr bool operator>( 
const duration<Rep1, Periodi>& lhs, 
const duration<Rep2, Period2>& rhs); 


template <class Rep1, class Periodi, class 
constexpr bool operator>=( 
const duration<Repi, Periodi>& lhs, 
const duration<Rep2, Period2>& rhs); 


Rep2, 


Rep2, 


Rep2, 


Rep2, 


Rep2, 


Rep2, 


class 


class 


class 


class 


class 


class 


template <class ToDuration, class Rep, class Period> 


Period2> 


Period2> 


Period2> 


Period2> 


Period2> 


Period2> 


constexpr ToDuration duration_cast(const duration<Rep, 


Period>& d); 


BR 
Rep 必须 是 内 置 数值 类 型 ， 或 是 自 定义 的 类 数值 类 型 。 


Period 必须 是 std::ratio<> 实例 。 


std::chrono::duration::Rep 类 型 


用 来 记录 dration 中 时 钟 周期 的 数量 。 


声明 
typedef Rep rep; 
rep 类 型 用 来 记录 duration 对 象 内 部 的 表示 。 


std::chrono::duration::Period 类 型 


这 个 类 型 必须 是 一 个 std::ratio 的 特 化 实例 ， 用 来 表示 在 继续 时 间 中 ，1s 所 要 记录 的 次 数 。 
例如 ， 当 period 是 std::ratio<1, 50> ， duration 变量 的 count() 就 会 在 N 秒 钟 返 回 50N ， 


声明 


typedef Period period; 


std::chrono::duration 默认 构造 函数 
使 用 默认 值 构 造 std::chrono: :duration 实例 


声明 


constexpr duration() = default; 


duration 内 部 值 (例如 rep 类 型 的 值 ) 都 已 初始 化 。 


std::chrono::duration 需要 计数 值 的 转换 构造 函数 
通过 给 定 的 数值 来 构造 std::chrono: :duration 实例 2 


声明 


template <class Rep2> 
constexpr explicit duration(const Rep2& r); 


duration 对 象 的 内 部 值 会 使 用 static_cast<rep>(r) 进行 初始 化 。 


结果 
当 Rep2 隐 式 转换 为 Rep，Rep 是 浮 点 类 型 或 Rep2 不 是 浮 点 类 型 ， 这 个 构造 函数 才能 使 用 。 


后 验 条 件 


this->count()==static_cast<rep>(r) 


std::chrono::duration 需要 另 一 个 std::chrono::duration 值 的 
转化 构造 函数 


通过 另 一 个 std::chrono::duration 类 实例 中 的 计数 值 来 构造 一 个 std::chrono: :duration 类 实 


template <class Rep2, class Period> 
constexpr duration(const duration<Rep2,Period2>& d); 


结果 


duration 对 象 的 内 部 值 通过 duration_cast<duration<Rep, Period>>(d).count() 初始 化 。 


BR 

当 Rep 是 一 个 浮 点 类 或 Rep2 不 是 浮 点 类 ， 且 Period2 是 Period 数 的 倍数 (比如 ， 
ratio_divide<Period2,Period>::den==1) 时 ， 才 能 调用 该 重 载 。 当 一 个 较 小 的 数据 转换 为 一 个 
较 大 的 数据 时 ， 使 用 该 构造 函数 就 能 避免 数位 截断 和 精度 损失 。 


后 验 条 件 


this->count() == dutation_cast&lt;duration<Rep, Period>>(d).count() 


例子 


duration<int, ratio<1, 1000>> ms(5); // 5 毫秒 

duration<int, ratio<1, 1>> s(ms); // 错误 : 不 能 将 ms 当做 s 进 行 存储 
duration<double, ratio<1,1>> s2(ms); // @%:s2.count() == 
0.005 

duration<int, ration<i, 1000000>> us<ms>; // @%:us.count() == 
5000 


std::chrono::duration::count ™% i 42 


查询 持续 时 长 。 


声明 


constexpr rep count() const; 


返回 duration 的 内 部 值 ， 其 值 类 型 和 rep 一 样 。 


std::chrono::duration::operator+ 加 法 操作 符 


这 是 一 个 空 操 作 : 只 会 返回 *this 的 副本 。 


constexpr duration operator+() const; 
返回 *this 


std::chrono::duration::operator- 减法 操作 符 
返回 将 内 部 值 只 为 负数 的 *this 副 本 。 


声明 
constexpr duration operator-() const; 
返回 duration(--this->count()); 


std::chrono::duration::operator++ 前 置 自 加 操作 符 
增加 内 部 计数 值 。 


声明 


duration& operator++(); 


++this->internal_count; 


返回 *this 


std::chrono::duration::operator++ 后 置 自 加 操作 符 
自 加 内 部 计数 值 ， 并 且 返 回 还 没有 增加 前 的 *this。 


声明 


duration operator++(int); 


duration temp(*this); 
++(*this); 


return temp; 


std::chrono::duration::operator-- 前 置 自 减 操作 符 
自 减 内 部 计数 值 


声明 


duration& operator--(); 


--this->internal_count; 
返回 *this 


std::chrono::duration::operator-- 前 置 自 减 操作 符 
自 减 内 部 计数 值 ， 并且 返 回 还 没有 减少 前 的 *this 。 


声明 


duration operator--(int); 


duration temp(*this); 
--(*this); 
return temp; 


std::chrono::duration::operatort+= 复合 赋值 操作 符 
将 其 他 duration 对 象 中 的 内 部 值 增加 到 现 有 duration 对 象 当 中 。 


声明 


duration& operator+=(duration const& other); 


internal_count+=other.count(); 
返回 *this 


std::chrono::duration::operator-= 复合 赋值 操作 符 
现 有 duration 对 象 减 去 其 他 duration 对 象 中 的 内 部 值 。 


声明 


duration& operator-=(duration const& other); 


internal_count-=other.count(); 
返回 *this 


std::chrono::duration::operator*= 复合 赋值 操作 符 
内 部 值 乘 以 一 个 给 定 的 值 。 


声明 


duration& operator*=(rep const& rhs); 


internal_count*=rhs; 
返回 *this 


std::chrono::duration::operator/= 复合 赋值 操作 符 
内 部 值 除 以 一 个 给 定 的 值 。 


声明 


duration& operator/=(rep const& rhs); 


internal_count/=rhs; 
返回 *this 


std::chrono::duration::operator%= 复合 赋值 操作 符 
内 部 值 对 一 个 给 定 的 值 求 余 。 


声明 


duration& operator%=(rep const& rhs); 


internal_count%=rhs; 
返回 *this 


std::chrono::duration::operator%= 复合 赋值 操作 符 ( 重 载 ) 
内 部 值 对 另 一 个 duration 类 的 内 部 值 求 余 。 


声明 


duration& operator%=(duration const& rhs); 


internal_count%=rhs.count(); 
返回 *this 


std::chrono::duration::zero ## A 7% ih HA 
返回 一 个 内 部 值 为 0 的 duration 对 象 。 


声明 

constexpr duration zero(); 
返回 

duration(duration_values<rep>::zero()); 
std::chrono::duration::min 静态 成 员 有 函数 


返回 duration 类 实例 化 后 能 表示 的 最 小 值 。 


声明 

constexpr duration min(); 
返回 

duration(duration_values<rep>: :min()); 
std::chrono::duration::max # A A. i BAR 


返回 duration 类 实例 化 后 能 表示 的 最 大 值 。 


声明 


constexpr duration max(); 
返回 


duration(duration_values<rep>: :max()); 


std::chrono::duration 等 于 比较 操作 符 
比较 两 个 duration 对 象 是 否 相 等 。 


声明 


template <class Rep1, class Periodi, class Rep2, class Period2> 
constexpr bool operator== 

const duration<Repi, Periodi>& lhs, 

const duration<Rep2, Period2>& rhs); 


BR 
lhs 和 rhs 两 种 类 型 可 以 互相 进行 隐 式 转换 。 当 两 种 类 型 无 法 进行 隐 式 转换 ， 或 是 可 以 互相 
转换 的 两 个 不 同类 型 的 duration 类 ， 则 表达 式 不 合理 。 


结果 
当 commonDuration 和 std::common_type< duration< Repi, Periodi>, duration< Rep2, 
Period2>>::type 同类 ， 那 么 1hs==rhs RAR 


回 CommonDuration(1lhs).count()==CommonDuration(rhs).count() ° 


std::chrono::duration 不 等 于 比较 操作 符 
比较 两 个 duration 对 象 是 否 不 相等 。 


声明 


template <class Repi, class Periodi, class Rep2, class Period2> 
constexpr bool operator! =( 

const duration<Rep1, Periodi>& lhs, 

const duration<Rep2, Period2>& rhs); 


BR 
lhs 和 rhs 两 种 类 型 可 以 互相 进行 隐 式 转换 。 当 两 种 类 型 无 法 进行 隐 式 转换 ， 或 是 可 以 互相 
转换 的 两 个 不 同类 型 的 duration 类 ， 则 表达 式 不 合理 。 


返回 !(lhs==rhs) 


std::chrono::duration 小 于 比较 操作 符 

比较 两 个 duration 对 象 是 否 小 于 。 

声明 
template <class Rep1, class Periodi, class Rep2, class Period2> 
constexpr bool operator<( 


const duration<Rep1, Periodi>& lhs, 
const duration<Rep2, Period2>& rhs); 


BR 
lhs 和 rhs 两 种 类 型 可 以 互相 进行 隐 式 转换 。 当 两 种 类 型 无 法 进行 隐 式 转换 ， 或 是 可 以 互相 
转换 的 两 个 不 同类 型 的 duration 类 ， 则 表达 式 不 合理 。 


结果 
当 CommonDuration 和 std: :common_type< duration< Repi, Periodi>, duration< Rep2, 
Period2>>:: type 同类 ， 那 么 lhs&lt; rhs 就 会 返 


回 CommonDuration(lhs).count()&lt;CommonDuration(rhs).count() ° 


std::chrono::duration 大 于 比较 操作 符 

比较 两 个 duration 对 象 是 否 大 于 。 

声明 
template <class Repi, class Periodi, class Rep2, class Period2> 
constexpr bool operator>( 


const duration<Rep1, Periodi>& lhs, 
const duration<Rep2, Period2>& rhs); 


lhs 和 rhs 两 种 类 型 可 以 互相 进行 隐 式 转换 。 当 两 种 类 型 无 法 进行 隐 式 转换 ， 或 是 可 以 互相 
转换 的 两 个 不 同类 型 的 duration 类 ， 则 表达 式 不 合理 。 


返回 rhs<lhs 
std::chrono::duration 小 于 等 于 比较 操作 符 


比较 两 个 duration 对 象 是 否 小 于 等 于 。 


声明 


template <class Rep1, class Periodi, class Rep2, class Period2> 
constexpr bool operator<=( 


const duration<Repi1, Periodi>& lhs, 
const duration<Rep2, Period2>& rhs); 


BR 


lhs 和 rhs 两 种 类 型 可 以 互相 进行 隐 式 转换 。 当 两 种 类 型 无 法 进行 隐 式 转换 ， 或 是 可 以 互相 
转换 的 两 个 不 同类 型 的 duration 类 ， 则 表达 式 不 合理 。 


返回 !(rhs<lhs) 


std::chrono::duration 大 于 等 于 比较 操作 符 
比较 两 个 duration 对 象 是 否 大 于 等 于 。 
声明 


template <class Rep1, class Period1，class Rep2, class Period2> 
constexpr bool operator>=( 


const duration<Rep1, Periodi>& lhs, 
const duration<Rep2, Period2>& rhs); 


lhs 和 rhs 两 种 类 型 可 以 互相 进行 隐 式 转换 。 当 两 种 类 型 无 法 进行 隐 式 转换 ， 或 是 可 以 互相 
转换 的 两 个 不 同类 型 的 duration 类 ， 则 表达 式 不 合理 。 


返回 !(Lhs<rhs) 
std::chrono::duration_cast }F R i $% žk 
显示 将 一 个 std::chrono::duration 对 象 转 化 为 另 一 个 std::chrono::duration 实例 ° 


声明 


template <class ToDuration, class Rep, class Period> 


constexpr ToDuration duration_cast(const duration<Rep, Period>& 
d); 


要 求 


ToDuration 必 须 是 std: :chrono: :duration 的 实例 。 

返回 

duration 类 d 转 换 为 指定 类 型 ToDuration。 这 种 方式 可 以 在 不 同 尺 寸 和 表示 类 型 的 转换 中 尽 可 
能 减少 精度 损失 。 


D.1.2 std::chrono::time_point& # 7% 74 


std::chrono::time_point 类 型 模板 通过 (特别 的 ) 时 钟 来 表示 某 个 时 间 点 。 这 个 时 钟 代表 的 是 从 
epoch(1970-01-01 00:00:00 UTC， 作 为 UNIX 系 列 系统 的 特定 时 间 戳 ) 到 现在 的 时 间 。 模 板 参 
数 Clock 代 表 使 用 的 使 用 (不 同 的 使 用 必定 有 自己 独特 的 类 型 )， 而 Duration 模 板 参 数 使 用 来 测 
量 从 epoch 到 现在 的 时 间 ， 并 且 这 个 参数 的 类 型 必须 是 std::chrono::duration 类 型 。Duration 
默认 存储 Clock 上 的 测量 值 。 


RAE LV 


template <class Clock,class Duration = typename Clock: :duration> 
class time_point 


{ 
public: 
typedef Clock clock; 
typedef Duration duration; 
typedef typename duration::rep rep; 
typedef typename duration::period period; 


time_point(); 
explicit time_point(const duration& d); 


template <class Duration2> 
time_point(const time_point<clock, Duration2>& t); 


duration time_since_epoch() const; 


time_point& operator+=(const duration& d); 
time_point& operator-=(const duration& d); 


static constexpr time_point min(); 
static constexpr time_point max(); 


ti 


std::chrono::time_point 默认 构造 函数 


构造 time_point 代 表 着 ， 使 用 相关 的 Clock， 记 录 从 epoch 到 现在 的 时 间 ; 其 内 部 计时 使 用 
Duration::zero() 进 行 初始 化 。 


声明 


time_point(); 


后 验 条 件 
对 于 使 用 默认 构造 函数 构造 出 的 time_point 对 象 tp ， tp,time_since_epoch() == 


tp::duration::zero() ° 


std::chrono::time_point 需要 时 间 长 度 的 构造 函数 


构造 time_point 代 表 着 ， 使 用 相关 的 Clock， 记 录 从 epoch 到 现在 的 时 间 。 


声明 
explicit time_point(const duration& d); 


后 验 条 件 

当 有 一 个 time_point 对 象 tp， 是 通过 duration d 构 造 出 来 的 (tp(d))， 那 么 tp.time_since_epoch() 
==") ° 

std::chrono::time_point 转换 构造 函数 

构造 time_point 代 表 着 ， 使 用 相关 的 Clock， 记 录 从 epoch 到 现在 的 时 间 。 

声明 


template <class Duration2> 
time_point(const time_point<clock, Duration2>& t); 


BR 
Duration2 必 须 呢 个 隐 式 转换 为 Duration ° 


当 time_point(t.time_since_epoch()) 存在 ， 从 ttime_since_epoch() 中 获取 的 返回 值 ， 可 以 隐 
式 转换 成 Duration 类 型 的 对 象 ， 并 且 这 个 值 可 以 存储 在 一 个 新 的 time_point 对 象 中 。 


(扩展 阅读 : as-if 准 则 ) 


std::chrono::time_point::time_since_epoch 成 员 有 函数 
返回 当前 time_point 从 epoch 到 现在 的 具体 时 长 。 


声明 
duration time_since_epoch() const; 


返回 
duration 的 值 存储 在 #this 中 。 


std::chrono::time_point::operatort= 复合 赋值 函数 


将 指定 的 duration 的 值 与 原 存 储 在 指定 的 time_point 对 象 中 的 duration 相 加 ， 并 将 加 后 值 存储 在 
*this 对 象 中 。 


声明 


time_point& operator+=(const duration& d); 


将 d 的 值 和 duration 对 象 的 值 相 加 ， 存 储 在 *this 中 ， 就 如 同 this->internal_duration += d; 


返回 *this 
std::chrono::time_point::operator-= 复合 赋值 函数 


将 指定 的 duration 的 值 与 原 存 储 在 指定 的 time_point 对 象 中 的 duration 相 减 ， 并 将 加 后 值 存 储 在 
*this 对 象 中 。 


声明 


time_point& operator-=(const duration& d); 


将 d 的 值 和 duration 对 象 的 值 相 减 ， 存 储 在 *this 中 ， 就 如 同 this->internal_duration -= d; 


返回 *this 


std::chrono::time_point::min 47 & A i HA 
获取 time_point 对 象 可 能 表示 的 最 小 值 。 


声明 
static constexpr time_point min(); 

返回 
time_point(time_point::duration::min()) (see 11.1.1.15) 


std::chrono::time_point::max @? SI 7 HA 


获取 time_point 对 象 可 能 表示 的 最 大 值 。 


声明 
static constexpr time_point max(); 
返回 


time_point(time_point::duration::max()) (see 11.1.1.16) 


D.1.3 std::chrono::system_clock žŽ 


std::chrono::system_clock 类 提供 给 了 从 系统 实时 时 钟 上 获取 当前 时 间 功 能 。 可 以 调 

用 std::chrono: :system_clock: :now() 来 获取 当前 的 时 

间 。 std::chrono: :System_clock::time_point 也 可 以 通 

过 std::chrono: :system_clock: :to_time_t() 和 std::chrono: :system_clock::to_time_point() % 
数 返 回 值 转换 成 time _t 类 型 。 系 统 时 钟 不 稳定 ， 所 以 std::chrono::system_clock::now() 获取 
到 的 时 间 可 能 会 早 于 之 前 的 一 次 调用 (比如 ， 时 钟 被 手动 调整 过 或 与 外 部 时 钟 进行 了 同步 )。 


类 型 定义 


class system clock 

{ 

public: 
typedef unspecified-integral-type rep; 
typedef std::ratio<unspecified, unspecified> period; 
typedef std::chrono::duration<rep, period> duration; 
typedef std::chrono::time_point<system_clock> time_point; 
static const bool is_steady=unspecified; 


static time_point now() noexcept; 


static time_t to_time_t(const time_point& t) noexcept; 





static time_point from_time_t(time_t t) noexcept; 


}; 


std::chrono::system_clock::rep 类 型 定义 


将 时 间 周 期 数 记录 在 一 个 duration 值 中 


声明 


typedef unspecified-integral-type rep; 


std::chrono::system_clock::period 类 型 定义 


类 型 为 std::ratio 类 型 模板 ， 通 过 在 两 个 不 同 的 duration 或 time_point 间 特 化 最 小 秒 数 (或 将 1 
秒 分 为 好 几 份 )。period 指 定 了 时 钟 的 精度 ， 而 非 时 钟 频率 。 


声明 


typedef std::ratio<unspecified,unspecified> period; 


std::chrono::system_clock::duration 类 型 定义 
类 型 为 std::ratio 类 型 模板 ， 通 过 系统 实时 时 钟 获取 两 个 时 间 点 之 间 的 时 长 。 


声明 


typedef std::chrono: :duration< 
std::chrono::system_clock::rep, 
std::chrono::system_clock::period> duration; 


std::chrono::system_clock::time_point 类 型 定义 

类 型 为 std::ratio 类 型 模板 ， 通 过 系统 实时 时 钟 获取 当前 时 间 点 的 时 间 。 

声明 
typedef std::chrono::time point&lt;std::chrono::system clock&gt,; 
time_point; 

std::chrono::system_clock::now # & 7% i BAe 

从 系统 实时 时 钟 上 获取 当前 的 外 部 设备 显示 的 时 间 。 

声明 


time_point now() noexcept; 


返回 
time_point 类 型 变量 来 代表 当前 系统 实时 时 钟 的 时 间 。 


抛 出 

当 错 误 发 生 ” std::system error 异常 将 会 抛 出 
std::chrono::system_clock:to_time_t a? & 7% 7 BA 
A$ time_point& #! 44 44 1t A time_t ° 


声明 


time_t to_time_t(time_point const& t) noexcept; 





返回 
通过 对 t 进 行 含 入 或 截断 精度 ， 将 其 转化 为 一 个 time t 类 型 的 值 。 
抛 出 

二 


当 错 误 发 生 ， std: :system_error 异常 将 会 抛 出 有 


std::chrono::system_clock::from_time_t 静态 成 员 遂 数 
声明 
time_point from_time_t(time_t const& t) noexcept; 
返回 
time_point 中 的 值 与 t 中 的 值 一 样 。 


抛 出 
当 错 误 发 生 ， std::system error 异常 将 会 抛 出 Š 


D.1.4 std::chrono::steady_clock 关 


std::chrono::steady_clock 能 访问 系统 稳定 时 钟 。 可 以 通过 调 

用 std: :chrono::steady_clock::now() 获取 当前 的 时 间 。 设 备 上 显示 的 时 间 ， 与 使 

用 std::chrono::steady_clock::now() 获取 的 时 间 没 有 固定 的 关系 。 稳 定时 钟 是 无 法 回调 的 ， 
所 以 在 std::chrono: :steady_clock::now() 两 次 调用 后 ， 第 二 次 调用 获取 的 时 间 必 定 等 于 或 大 
于 第 一 次 获得 的 时 间 。 时 钟 以 国定 的 速率 进行 计时 。 


类 型 定义 


class steady_clock 


{ 
public: 
typedef unspecified-integral-type rep; 
typedef std::ratio< 
unspecified, unspecified> period; 
typedef std::chrono::duration<rep, period> duration; 
typedef std::chrono: :time_point<steady_clock> 
time_point; 
static const bool is_steady=true; 


static time_point now() noexcept; 
}; 
std::chrono::steady_clock::rep 类 型 定义 
定义 一 个 整 型 ， 用 来 保存 duration 的 值 。 


声明 


typedef unspecified-integral-type rep; 


std::chrono::steady_clock::period 类 型 定义 


类 型 为 std: :ratio 类 型 模板 ， 通 过 在 两 个 不 同 的 duration 或 time_point 间 特 化 最 小 秒 数 (或 将 1 
秒 分 为 好 几 份 )。period 指 定 了 时 钟 的 精度 ， 而 非 时 钟 频率 。 


声明 
typedef std: :ratio<unspecified,unspecified> period; 


std::chrono::steady_clock::duration 类 型 定义 


类 型 为 std::ratio 类 型 模板 ， 通 过 系统 实时 时 钟 获取 两 个 时 间 点 之 间 的 时 长 


声明 


o 


typedef std::chrono: :duration< 
std::chrono::system_clock::rep, 
std::chrono::system_clock::period> duration; 


std::chrono::steady_clock::time_point 类 型 定义 
std::chrono::time_point 类 型 实例 ， 可 以 存储 从 系统 稳定 时 钟 返回 的 时 间 点 。 
声明 


typedef std::chrono::time_point<std::chrono::steady_clock> 
time_point; 


std::chrono::steady_clock::now 静态 成 员 函 数 
从 系统 稳定 时 钟 获取 当前 时 间 。 


声明 


time_point now() noexcept; 


返回 
time point 表示 当前 系统 稳定 时 钟 的 时 间 。 


抛 出 
当 遇 到 错误 ， 会 抛 出 std::system error 异常 。 


同步 
当先 行 调用 过 一 次 std::chrono::steady_clock::now() ， 那 么 下 一 次 time_point 获 取 的 值 ， 一 定 
大 于 等 于 第 一 次 获取 的 值 。 


` 


D.1.5 std::chrono::high_resolution_clock® © XX 


td: :chrono: :high_resolution_clock 类 能 访问 系 统 高 精度 时 钟 。 。 和 所 有 其 他 时 钟 一 样 ， 通 过 调 
用 std::chrono: :high_resolution_clock: :now() 来 获取 当 前 时 


间 。 std::chrono: :high_resolution_ clock 可 能 是 std: :chrono: :system_clock 类 
或 std: :chrono: :steady_clock 类 的 别名 ， 也 可 能 就 是 独立 的 一 个 类 。 


通过 std: :chrono: :high_resolution_clock 具有 所 有 标 准 库 支持 时 钟 中 最 高 的 精度 》 这 就 意味 
着 使 用 std::chrono: :high_resolution_clock: :now() 要 花 掉 一 些 时 间 。 所 以 ， 当 你 再 调 
用 std::chrono::high_resolution_clock::now() 的 时 候 ， 需 要 注意 函数 本 身 的 时 间 开 销 。 


类 型 定义 


class high_resolution_clock 
{ 
public: 
typedef unspecified-integral-type rep; 
typedef std::ratio< 
unspecified, unspecified> period; 
typedef std::chrono: :duration<rep, period> duration; 
typedef std::chrono::time_point< 
unspecified> time_point; 
static const bool is_steady=unspecified; 


static time_point now() noexcept; 


ia 


D.2 <condition_variable> xX 4} 


<condition_variable> 头 文件 提供 了 条 件 变量 的 定义 。 其 作为 基本 同步 机 制 ， 人 允许 被 阻塞 的 线 
程 在 某 些 条 件 达 成 或 超时 时 ， 解 除 阻 塞 继续 执行 。 


头 文件 内 容 


namespace std 


i 


enum class cv_status { timeout, no_timeout }; 


class condition_variable; 
class condition_variable_any; 


D.2.1 std::condition_variable & 


std::condition variable 允许 阻塞 一 个 线程 ， 直 到 条 件 达 成 。 


std::condition_variable 实例 不 支持 CopyAssignable( 拷 贝 赋值 ), CopyConstructible( 找 贝 构 
造 ), MoveAssignable( 移 动 赋值 ) 和 MoveConstructible( 移 动 构造 )。 


类 型 定义 


class condition_variable 

{ 

public: 
condition_variable(); 
~condition_variable(); 


condition_variable(condition_variable const& ) = delete; 
condition_variable& operator=(condition_variable const& ) = 
delete; 


void notify_one() noexcept; 
void notify_all() noexcept; 


void wait(std::unique_lock<std::mutex>& lock); 


template <typename Predicate> 
void wait(std: :unique_lock<std: :mutex>& lock,Predicate pred); 


template <typename Clock, typename Duration> 
cv_status wait_until( 
std: :unique_lock<std: :mutex>& lock, 
const std::chrono::time_point<Clock, Duration>& 
absolute_time); 


template <typename Clock, typename Duration, typename 
Predicate> 
bool wait_until( 
std: :unique_lock<std: :mutex>& lock, 
const std::chrono::time_point<Clock, Duration>& 
absolute_time, 
Predicate pred); 


template <typename Rep, typename Period> 
cv_status wait_for( 
std: :unique_lock<std: :mutex>& lock, 
const std::chrono::duration<Rep, Period>& relative_time); 


template <typename Rep, typename Period, typename Predicate> 
bool wait_for( 
std: :unique_lock<std: :mutex>& lock, 
const std::chrono::duration<Rep, Period>& relative_time, 
Predicate pred); 


}; 
void 
notify_all_at_thread_exit(condition_variable&, unique_lock<mutex> 
); 
std::condition_variable 默认 构造 函数 


构造 一 个 std::condition variable xt Ee 9 


声明 


condition_variable(); 
构造 一 个 新 的 std::condition_variable 实例 e 
抛 出 


当 条 件 变量 无 法 够 旱 的 时 候 4 将 会 抛 出 一 个 std::system_error 异常 2 


std::condition_variable #174 % žx 
销毁 一 个 std: :condition_variable 对 象 2 


声明 


~condition_variable(); 


先决 条 件 
之 前 没有 使 用 *this 总 的 wait(),wait_ for() 或 wait_until() 阻 塞 过 线程 。 


销毁 *this。 


抛 出 

元 

std::condition_variable::notify_one 成 员 有 函数 
唤醒 一 个 等 待 当 前 std::condition_variable 实例 的 线程 。 


声明 


void notify_one() noexcept; 


唤醒 一 个 等 待 *this 的 线程 。 如 果 没 有 线程 在 等 待 ， 那 么 调用 没有 任何 效果 。 


抛 出 
当 效 果 没 有 达成 ， 就 会 抛 出 std: :system_error 异常 


同步 

std::condition_variable 实例 中 的 notify_one(),notify_all(),wait(),wait_for() 和 wait_until() 都 是 
序列 化 函数 ( 串 行 调用 )。 调 用 notify_one() 或 notify_all() 只 能 唤醒 正在 等 待 中 的 线程 。 
std::condition_variable::notify_all - ii % 2 
唤醒 所 有 等 待 当 前 std::condition variable 实例 的 线程 。 


声明 


void notify_all() noexcept; 


效果 
唤醒 所 有 等 待 Xhis 的 线程 。 如 果 没 有 线程 在 等 待 ， 那 么 调用 没有 任何 效果 。 


抛 出 
当 效 果 没 有 达成 ， 就 会 抛 出 std::system_error 异常 


同步 
std::condition_variable 实例 中 的 notify_one(),notify_all(),wait(),wait_for() 和 wait_until() 都 是 
序列 化 函数 ( 串 行 调用 )。 调 用 notify_one() 或 notify_all() 只 能 唤醒 正在 等 待 中 的 线程 。 


std::condition_variable::wait X i 42% 


通过 std::condition_variable 的 notify_one()、notify_all() 或 伪 唤 醒 结束 等 待 。 


void wait(std::unique_lock<std::mutex>& lock); 


先决 条 件 
当 线 程 调用 wait() 即 可 获得 锁 的 所 有 权 ,lock.owns_lock() 必 须 为 true。 


自动 解锁 lock 对 象 ， 对 于 线程 等 待 线程 ， 当 其 他 线程 调用 notify_one() 或 notify_all() 时 被 唤醒 ， 
亦 或 该 线程 处 于 伪 唤 本 状态。 在 wait() 返 回 前 ，lock 对 象 将 会 再 次 上 锁 。 


抛 出 
当 效 果 没 有 达成 的 时 候 ， 将 会 抛 出 std::systemerror 异常 。 当 lock 对 象 在 调用 wait() 阶 段 被 解 
锁 ， 那 么 当 wait() 退 出 的 时 候 lock 会 再 次 上 锁 ， 即 使 函数 是 通过 异常 的 方式 退出 。 


NOTE: 伪 唤醒 意味 着 一 个 线程 调用 wait() 后 ， 在 没有 其 他 线程 调用 notify_one() 或 notify_all() 
时 ， 还 处 以 苏醒 状态 。 因 此 ， 建 议 对 wait() 进 行 重 载 ， 在 可 能 的 情况 下 使 用 一 个 谓词 。 否 则 ， 
建议 wait() 使 用 循环 检查 与 条 件 变 量 相关 的 谓词 。 
同步 

std::condition_variable 实例 中 的 notify_one(),notify_all(),wait(),wait_for() 和 wait_until() 都 是 
序列 化 函数 ( 串 行 调用 )。 调 用 notify_one() 或 notify_all() 只 能 唤醒 正在 等 待 中 的 线程 。 


std::condition_variable::wait 需要 一 个 谓词 的 成 员 函 数 重 载 


等 待 std::condition_variable 上 的 notify_ one() 或 notify_all() 被 调用 ， 或 谓词 为 true 的 情况 ， 来 
唤醒 线程 。 


声明 


template<typename Predicate> 
void wait(std::unique_lock<std::mutex>& lock,Predicate pred); 


先决 条 件 
pred() 谓 词 必 须 是 合法 的 ， 并 且 需 要 返回 一 个 值 ， 这 个 值 可 以 和 bool 互 相 转 化 。 当 线程 调用 
wait() 即 可 获得 锁 的 所 有 权 ,lock.owns_lock() 必 须 为 true 。 


正如 


while(!pred()) 


{ 
wait(lock); 


抛 出 
pred 中 可 以 抛 出 任意 异常 ? 或 者 当 效果 没有 达到 的 时 候 ， 抛 出 std: :system_error 异常 8 


NOTE: 洪 在 的 伪 唤 醒 意 味 着 不 会 指定 pred 调 用 的 次 数 。 通 过 lock 进 行 上 锁 ，pred 经 常会 被 互 斤 
量 引 用 所 调用 ， 并 且 函 数 必 须 返 回 ( 只 能 返回 ) 一 个 值 ， 在 (bool)pred() 评估 后 ， 返 回 true。 


同步 
std::condition_variable 实例 中 的 notify_one(),notify_all(),wait(),wait_for() 和 wait_until() 都 是 
序列 化 函数 ( 串 行 调用 )。 调 用 notify_one() 或 notify_all() 只 能 唤醒 正在 等 待 中 的 线程 。 


std::condition_variable::wait_for % i % žr 


std::condition_variable 在 调用 notify_one()、 调 用 notify_all()、 超 时 或 线程 伪 唤 醒 时 ， 结 束 


声明 


template<typename Rep, typename Period> 
cv_status wait_for( 
std: :unique_lock<std: :mutex>& lock, 
std::chrono: :duration<Rep, Period> const& relative_time); 


先决 条 件 
当 线 程 调用 wait() 即 可 获得 锁 的 所 有 权 ,lock.owns_lock() 必 须 为 true 。 


FeRAM notify_one()Anotify_all() H žit > RÆ H T relative time 的 时 间 ， 亦 或 是 线程 
ae ， 则 将 lock 对 象 自 动 解锁 ， 并 将 阻塞 线程 唤醒 。 当 wait for() 调 用 返回 前 ，lock 对 象 会 
再 次 上 人 锁 。 


返回 
线程 被 notify_one()、notify_all() 或 伪 唤 醒 唤醒 时 ， 会 返回 std::cv_status::no_timeout ; 反 


之 ， 则 返回 std::cv_status::timeout 。 


抛 出 
当 效 果 没 有 达成 的 时 候 ， 会 抛 出 std::system_error 异常 。 当 lock 对 象 在 调用 wait_ for() 函 数 前 
Apa > ABAlock*t RA zwait_for()i£ BAT ARK LAM > BPE BARU HAY A AGB o 


NOTE: 伪 唤醒 意味 着 ， 一 个 线程 在 调用 wait_for() 的 时 候 ， 即 使 没有 其 他 线程 调用 notify_one() 
和 notify_all() 函 数 ， 也 处 于 苏醒 状态 。 因 此 ， 这 里 建议 重 载 wait_for() 函 数 ， 重 载 函 数 可 以 使 用 
谓词 。 要 不 ， 则 建议 wait_for() 使 用 循环 的 方式 对 与 谓词 相关 的 条 件 变 量 进行 检查 。 在 这 样 做 

的 时 候 还 需要 小 心 ， 以 确保 超时 部 分 依 日 有效 ; Wait_until() 可 能 适合 更 多 的 情况 。 这 样 的 话 ， 
线程 阻塞 的 时 间 就 要 比 指定 的 时 间 长 了 。 在 有 这 样 可 能 性 的 地 方 ， 流 逝 的 时 间 是 由 稳定 时 钟 

决定 。 

同步 

std::condition_variable 实例 中 的 notify_one(),notify_all(),wait(),wait_for() 和 wait_until() 都 是 
序列 化 函数 ( 串 行 调用 )。 调 用 notify_one() 或 notify_all() 只 能 唤醒 正在 等 待 中 的 线程 。 


std::condition_variable::wait_for 需要 一 个 谓词 的 成 员 有 函数 重 
载 
std::condition_variable 在 调用 notify_ one()、 调 用 notify all()、 起 时 或 线程 伪 唤 醒 时 ， 结 束 


声明 


template<typename Rep, typename Period, typename Predicate> 
bool wait_for( 


std: :unique_lock<std::mutex>& lock, 
std: :chrono: :duration<Rep, Period> const& relative_time, 
Predicate pred); 


先决 条 件 
pred() 谓 词 必须 是 合法 的 ， 并 且 需 要 返回 一 个 值 ， 这 个 值 可 以 和 bool 互 相 转 化 。 当 线程 调用 
wait() 即 可 获得 锁 的 所 有 权 ,lock.owns_lock() 必 须 为 true 。 


效果 
等 价 于 


internal_clock::time_point 
end=internal_clock: :now()+relative_time; 
while(!pred()) 
{ 
std::chrono::duration<Rep, Period> remaining_time= 
end-internal_clock: :now(); 
if(wait_for(lock, remaining _time)==std::cv_status::timeout ) 
return pred(); 


} 


return true; 


返回 

当 pred() 为 true， 则 返回 true ; 当 超过 relative time 并且 pred() 返 回 false 时 ， 返 回 false。 
NOTE: 潜 在 的 伪 唤 醒 意 味 着 不 会 指定 pred 调 用 的 次 数 。 通 过 Ilock 进 行 上 锁 ，pred 经 常会 被 互 斤 
量 引 用 所 调用 ， 并 且 函 数 必 须 返 回 ( 只 能 返回 ) 一 个 值 ， 在 (bool)pred() 评估 后 返回 true， 或 在 
指定 时 间 relative time 内 完成 。 线 程 阻 塞 的 时 间 就 要 比 指定 的 时 间 长 了 。 在 有 这 样 可 能 性 的 地 
方 ， 流 逝 的 时 间 是 由 稳定 时 钟 决定 。 

抛 出 

当 效 果 没 有 达成 时 ， 会 抛 出 std: :system_error 异常 或 者 由 pred 抛 出 任意 异常 ? 


同步 


std::condition_variable 实例 中 的 notify_one(),notify_all(),wait(),wait_for() 和 wait_until() 都 是 
序列 化 函数 ( 串 行 调用 )。 调 用 notify_one() 或 notify_all() 只 能 唤醒 正在 等 待 中 的 线程 。 


std::condition_variable::wait_until 成 员 有 函数 


std::condition_variable 在 调用 notify one()、 调 用 notify all()、 指 定时 间 内 达成 条 件 或 线程 
伪 唤 醒 时 ， 结 束 等 待 。 


声明 


template<typename Clock, typename Duration> 
cv_status wait_until( 
std: :unique_lock<std: :mutex>& lock, 
std::chrono::time_point<Clock, Duration> const& 
absolute_time); 


先决 条 件 
当 线 程 调用 wait() 即 可 获得 锁 的 所 有 权 ,lock.owns_lock() 必 须 为 true 。 


当 其 他 线程 调用 notify_one() 或 notify_all() 函 数 ， 或 Clock::now() 返 回 一 个 大 于 或 等 于 
absolute time 的 时 间 ， 亦 或 线程 伪 唤 醒 ，lock 都 将 自动 解锁 ， 并 且 唤 醒 阻塞 的 线程 。 在 
wait_until() 返 回 之 前 lock 对 象 会 再 次 上 人 锁 。 


返回 
线程 被 notify_one()、notify_all() 或 伪 唤 醒 唤 醒 时 ， 会 返回 std::cv_status::no_timeout ; 反 


Re 则 返回 std: :cv_status::timeout ° 


抛 出 
当 效 果 没 有 达成 的 时 候 ， 会 抛 出 std::system_error 异常 。 当 lock 对 象 在 调用 wait for() 函 数 前 
解锁 ， 那 么 lock 对 象 会 在 wait_for() 退 出 前 再 次 上 锁 ， 即 使 函数 是 以 异常 的 方式 退出 。 


NOTE: 伪 唤醒 意味 着 一 个 线程 调用 wait() 后 ， 在 没有 其 他 线程 调用 notify_one() 或 notify_all() 

时 ， 还 处 以 苏醒 状态 。 因 此 ， 这 里 建议 重 载 wait_Uuntil() 函 数 ， 重 载 函 数 可 以 使 用 谓词 。 要 不 ， 
则 建议 wait_until() 使 用 循环 的 方式 对 与 谓词 相关 的 条 件 变 量 进 行 检查 。 这 里 不 保证 线程 会 被 阻 
塞 多 长 时 间 ， 只 有 当 函 数 返回 false 后 (Clock::now() 的 返回 值 大 于 或 等 于 absolute time)， 线 程 
才能 解除 阻塞 。 


同步 
std::condition_variable 实例 中 的 notify_one(),notify_all(),wait(),wait_for() 和 wait_until() 都 是 
序列 化 函数 ( 串 行 调用 )。 调 用 notify_one() 或 notify_all() 只 能 唤醒 正在 等 待 中 的 线程 。 


std::condition_variable::wait_until 需要 一 个 谓词 的 成 员 有 函数 
重 载 


std::condition_variable 在 调用 notify_one()、 调 用 notify_all()、 谓 词 返 回 true 或 指定 时 间 内 达 
到 条 件 ， 结 束 等 待 。 


声明 


template<typename Clock, typename Duration, typename Predicate> 
bool wait_until( 

std: :unique_lock<std: :mutex>& lock, 

std::chrono::time_point<Clock, Duration> const& 
absolute_time, 

Predicate pred); 


先决 条 件 
pred() 必 须 是 合法 的 ， 并 且 其 返回 值 能 转换 为 bool 值 。 当 线程 调用 wait() 即 可 获得 锁 的 所 有 
权 ,lock.owns_lock() 必 须 Sa o 


效果 
等 价 于 


while(!pred()) 
{ 
if(wait_until(lock,absolute_time)==std::cv_status::timeout) 
return pred(); 


} 


return true; 


返回 
当 调 用 pred() 返 回 true 时 ， 返 回 true ; 当 Clock::now() 的 时 间 大 于 或 等 于 指定 的 时 间 
absolute time， 并 且 pred() 返 回 false 时 ， 返 回 false。 


NOTE: 潜 在 的 伪 唤 醒 意 味 着 不 会 指定 pred 调 用 的 次 数 。 通 过 lock 进 行 上 锁 ，pred 经 常会 被 互 斤 
量 引 用 所 调用 ， 并 且 函 数 必须 返回 (只 能 返回 ) 一 个 值 ， 在 (bool)pred() 评估 后 返回 true， 或 
Clock::now() 返 回 的 时 间 大 于 或 等 于 absolute time。 这 里 不 保证 调用 线程 将 被 阻塞 的 时 长 ， 只 
有 当 遂 数 返 回 false 后 (Clock::now() 返 回 一 个 等 于 或 大 于 absolute_time 的 值 )， 线 程 接触 阻塞 。 


抛 出 
当 效 果 没 有 达成 时 ， 会 抛 出 std::system_error 异常 或 者 由 pred 抛 出 任意 异常 。 
同步 
std::condition_variable 实例 中 的 notify_one(),notify_all(),wait(),wait_for() 和 wait_until() 都 是 
序列 化 函数 ( 串 行 调用 )。 调 用 notify_one() 或 notify_all() 只 能 唤醒 正在 等 待 中 的 线程 。 


std::notify_all_at_thread_exit #2 7% i HA 
当当 前 调用 函数 的 线程 退出 时 ， 等 待 std::condition variable 的 所 有 线程 将 会 被 唤醒 。 


声明 


void notify_all_at_thread_exit( 
condition_variable& cv, unique_lock<mutex> 1k); 


先决 条 件 
当 线 程 调用 wait() 即 可 获得 锁 的 所 有 权 ,k.owns_lock() 必 须 为 true。Ik.mutex() 需 要 返回 的 值 要 
与 并 发 等 待 线程 相关 的 任意 cv 中 锁 对 象 提供 的 wait(),wait_for() 或 wait_until() 相 同 。 


将 上 k 的 所 有 权 转 移 到 内 部 存储 中 ， 并 且 当 有 线程 退出 时 ， 安 排 被 提醒 的 Cv 类 。 这 里 的 提醒 等 价 
T 


lk.unlock(); 
cv.notify_all(); 


抛 出 
当 效 果 没 有 达成 时 ， 抛 出 std::system error 异常 。 


NOTE: 在 线程 退出 前 ， 掌 握 着 锁 的 所 有 权 ， 所 以 这 里 要 避免 死 锁 发 生 。 这 里 建议 调用 该 济 数 
的 线程 应 该 尽快 退出 ， 并 且 在 该 线程 可 以 执行 一 些 阻 塞 的 操作 。 用 户 必须 保证 等 地 线程 不 会 
Wn 已 退出 的 线程 ， 特 别 是 伪 唤 醒 。 可 以 通过 等 待 线程 上 的 谓词 测试 来 实 
这 一 功能 ， 在 互 斥 量 保护 的 情况 下 ， 只 有 谓词 返回 true 时 线程 才能 被 唤醒 ， 并 且 在 调用 
让 会 释放 锁 。 


D.2.2 std::condition_variable_any 关 


std::condition_variable_any 类 允许 线程 等 待 某 一 条 件 为 true 的 时 候 继续 运行 。 不 
过 std::condition_variable 上 只 能 和 std: :unique_lock<std: :mutex> 一 起 使 
用 ， std::condition_variable_any 可 以 和 任意 可 上 人 锁 (Lockable) 类 型 一 起 使 用 2 


std: :condition_variable_any 实例 不 能 进行 拷贝 赋值 (CopyAssignable) 、 拷 贝 构造 
(CopyConstructible)、 移 动 赋值 (MoveAssignable) 或 移动 构造 (MoveConstructible)。 


类 型 定义 


class condition_variable_any 

{ 

public: 
condition_variable_any(); 
~condition_variable_any(); 


condition_variable_any( 
condition_variable_any const& ) = delete; 

condition_variable_any& operator=( 
condition_variable_any const& ) = delete; 


void notify_one() noexcept; 
void notify_all() noexcept; 


template<typename Lockable> 
void wait(Lockable& lock); 


template <typename Lockable, typename Predicate> 
void wait(Lockable& lock, Predicate pred); 


template <typename Lockable, typename Clock,typename Duration> 
std::cv_status wait_until( 
Lockable& lock, 
const std::chrono::time_point<Clock, Duration>& 
absolute _time); 


template < 
typename Lockable, typename Clock, 
typename Duration, typename Predicate> 
bool wait_until( 
Lockable& lock, 
const std::chrono::time_point<Clock, Duration>& 
absolute_time, 
Predicate pred); 


template <typename Lockable, typename Rep, typename Period> 
std::cv_status wait_for( 

Lockable& lock, 

const std::chrono::duration<Rep, Period>& relative_time); 


template < 
typename Lockable, typename Rep, 
typename Period, typename Predicate> 
bool wait_for( 
Lockable& lock, 
const std::chrono::duration<Rep, Period>& relative_time, 
Predicate pred); 


7 


std::condition_variable_any 默认 构造 函数 
构造 一 个 std::condition_variable_any 对 象 5 


声明 


condition_variable_any(); 
效果 
构造 一 个 新 的 std: :condition_variable_any 实例 。 
抛 出 
当 条 件 变 量 构造 成 功 2 将 抛 出 std::system_error 异常 9 
std::condition_variable_any 77 #4 4 %& 
销毁 std: :condition_variable_any 对 象 


声明 


~condition_variable_any(); 


先决 条 件 
之 前 没有 使 用 *this 总 的 wait(),wait_for() 或 wait_until() 阻 塞 过 线程 。 


效果 
销毁 *this。 


抛 出 
无 


std::condition_variable_any::notify_one ™% ii % žr 


std::condition variable_any 唤醒 一 个 等 待 该 条 件 变 量 的 线程 。 


声明 


void notify_all() noexcept; 
唤醒 一 个 等 待 *this 的 线程 。 如 果 没 有 线程 在 等 待 ， 那 么 调用 没有 任何 效果 


抛 出 
ARAA AK > BAH Kstd::system_errort % ° 


同步 

std::condition_variable 实例 中 的 notify_one(),notify_all(),wait(),wait_for() 和 wait_until() 都 是 
序列 化 函数 ( 串 行 调用 )。 调 用 notify_one() 或 notify_all() 只 能 唤醒 正在 等 待 中 的 线程 。 
std::condition_variable_any::notify_all % i 4 2 
唤醒 所 有 等 待 当前 std: :condition_variable_any 实例 的 线程 。 


声明 


void notify_all() noexcept; 


唤醒 所 有 等 待 *this 的 线程 。 如 果 没 有 线程 在 等 待 ， 那 么 调用 没有 任何 效果 


抛 出 
ARAA AK > HAV Kstd::system_errort % ° 


同步 

std::condition_variable 实例 中 的 notify_one(),notify_all(),wait(),wait_for() 和 wait_until() 都 是 
序列 化 函数 ( 串 行 调用 )。 调 用 notify_one() 或 notify_all() 只 能 唤醒 正在 等 待 中 的 线程 。 
std::condition_variable_any::wait 成 员 有 函数 
通过 std::condition_variable_any 的 notify_one()、notify_all() 或 伪 唤 醒 结 束 等 待 。 
声明 


template<typename Lockable> 
void wait(Lockable& lock); 


先决 条 件 
Lockable 类 型 需要 能 够 上 锁 ，lock 对 象 拥 有 一 个 锁 。 


效果 
自动 解锁 lock 对 象 ， 对 于 线程 等 待 线程 ， 当 其 他 线程 调用 notify_one() 或 notify_all() 时 被 唤醒 > 
亦 或 该 线程 处 于 伪 唤 醒 状态 。 在 Wait() 返 回 前 ，lock 对 象 将 会 再 次 上 锁 。 


Pa h 
当 效 果 没 有 达成 的 时 候 ， 将 会 抛 出 std: :system_error 异常 。 当 lock 对 象 在 调用 wait() 阶 段 被 解 
锁 ， 那 么 当 wait() 退 出 的 时 候 lock 会 再 次 上 锁 ， 即 使 函数 是 通过 异常 的 方式 退出 。 


AS 
时 ， 还 处 以 苏醒 状态 。 因 此 ， 建 议 对 wait() 进 行 重 载 ， 在 可 能 的 情况 下 使 用 一 个 谓词 。 否 则 ， 
建议 wait() 使 用 循环 检查 与 条 件 变 量 相关 的 谓词 。 


同步 
std::condition_variable_any 实 例 中 的 notify_one(),notify_all(),wait(),wait_for() 和 wait_until() 都 
是 序列 化 函数 ( 串 行 调用 )。 调 用 notify_one() 或 notify_all() 只 能 唤醒 正在 等 待 中 的 线程 。 


std::condition_variable_any::wait 需要 一 个 谓词 的 成 员 函 数 重 
载 

等 待 std::condition_variable_any 上 的 notify_one() 或 notify_all() 被 调用 ， 或 谓词 为 true 的 情 
况 ， 来 唤醒 线程 。 


声明 


template<typename Lockable, typename Predicate> 
void wait(Lockable& lock,Predicate pred); 


先决 条 件 
pred() 谓 词 必 须 是 合法 的 ， 并 且 需 要 返回 一 个 值 ， 这 个 值 可 以 和 bool 互 相 转化 。 当 线程 调用 
wait() 即 可 获得 锁 的 所 有 权 ,lock.owns_lock() 必 须 为 true 。 


效果 
正如 


while(!pred()) 
{ 

wait(lock); 

} 


抛 出 
pred 中 可 以 抛 出 任意 异常 ， 或 者 当 效 果 没 有 达到 的 时 候 ， 抛 出 sta: :System_error 异常 。 


NOTE: 洪 在 的 伪 唤 醒 意 味 着 不 会 指定 pred 调 用 的 次 数 。 通 过 lock 进 行 上 锁 ，pred 经 常会 被 互 斤 
量 引 用 所 调用 ， 并 且 函 数 必 须 返 回 ( 只 能 返回 ) 一 个 值 ， 在 (bool)pred() 评估 后 ， 返 回 true。 


同步 
std::condition_variable_any 实例 中 的 notify_one(),notify_all(),wait(),wait_for() 和 wait_until() 
都 是 序列 化 函数 ( 串 行 调 用 )。 调 用 notify_one() 或 notify_all() 只 能 唤醒 正在 等 待 中 的 线程 。 


std::condition_variable_any::wait_for 成 员 有 函数 


std::condition_variable_any 在 调用 notify one()、 调 用 notify_all()、 起 时 或 线程 伪 唤 醒 时 ， 结 
REM 


声明 


template<typename Lockable, typename Rep, typename Period> 
std::cv_status wait_for( 

Lockable& lock, 

std::chrono: :duration<Rep, Period> const& relative_time); 


先决 条 件 
当 线 程 调用 wait() 即 可 获得 锁 的 所 有 权 ,lock.owns_lock() 必 须 为 true 。 


当 其 他 线程 调用 notify_one() 或 notify_all() 函 数 时 ， 或 超出 了 relative_ time 的 时 间 ， 亦 或 是 线程 
被 伪 唤 醒 ， 则 将 lock 对 象 自动 解锁 ， 并 将 阻塞 线程 唤醒 。 当 wait for() 调 用 返回 前 ，lock 对 象 会 
再 次 上 锁 。 

返回 

线程 被 notify_one()、notify_all() 或 伪 唤 醒 唤 醒 时 ， 会 返回 std::cv_status::no_timeout ; 反 
之 ， 则 返回 std::cv_status::timeout ° 


Pa h 
当 效 果 没 有 达成 的 时 候 ， 会 抛 出 std::system_error 异常 。 当 lock 对 象 在 调用 wait_ for() 函 数 前 
解锁 ， 那 么 lock 对 象 会 在 wait for() 退 出 前 再 次 上 锁 ， 即 使 函数 是 以 弄 常 的 方式 退出 。 


NOTE: 伪 唤醒 意味 着 ， 一 个 线程 在 调用 wait_for() 的 时 候 ， 即 使 没有 其 他 线程 调用 notify_one() 
和 notify_all() 函 数 ， 也 处 于 苏醒 状态 。 因 此 ， 这 里 建议 重 载 wait_ for() 函 数 ， 重 载 函 数 可 以 使 用 
谓词 。 要 不 ， 则 建议 wait_for() 使 用 循环 的 方式 对 与 谓词 相关 的 条 件 变 量 进行 检查 。 在 这 样 做 


的 时 候 还 需要 小 心 ， 以 确保 超时 部 分 依 日 有效 ; wait_until() 可 能 适合 更 多 的 情况 。 这 样 的 话 ， 
线程 阻塞 的 时 间 就 要 上 比 指定 的 时 间 长 了 。 在 有 这 样 可 能 性 的 地 方 ， 流 逝 的 时 间 是 由 稳定 时 钟 
决定 。 


同步 
std::condition_variable_any 实例 中 的 notify_one(),notify_all(),wait(),wait_for() 和 wait_until() 
都 是 序列 化 函数 ( 串 行 调用 )。 调 用 notify_one() 或 notify_all() 只 能 唤醒 正在 等 待 中 的 线程 。 


std::condition_variable_any::wait_for 需要 一 个 谓词 的 成 员 郊 
数 重 载 


std::condition_variable_any 在 调用 notify one()、 调 用 notify all()、 起 时 或 线程 伪 唤 醒 时 ， 结 
REM 


声明 


template<typename Lockable, typename Rep, 
typename Period, typename Predicate> 
bool wait_for( 
Lockable& lock, 
std: :chrono: :duration<Rep, Period> const& relative_time, 
Predicate pred); 


先决 条 件 
pred() 谓 词 必须 是 合法 的 ， 并 且 需 要 返回 一 个 值 ， 这 个 值 可 以 和 bool 互 相 转化 。 当 线程 调用 
wait() 即 可 获得 锁 的 所 有 权 ,lock.owns_lock() 必 须 为 true 。 


效果 
正如 


internal_clock::time_point 
end=internal_clock: :now()+relative_time; 
while(!pred()) 
{ 
std::chrono::duration<Rep, Period> remaining_time= 
end-internal_clock: :now(); 
if(wait_for(lock, remaining _time)==std::cv_status::timeout ) 
return pred(); 


} 


return true; 


返回 
当 pred() 为 true， 则 返回 true ; 当 超过 relative _ time 并且 pred() 返 回 false 时 ， 返 回 false ° 


NOTE: 潜在 的 伪 唤 醒 意 味 着 不 会 指定 pred 调 用 的 次 数 。 通 过 lock 进 行 上 锁 ，pred 经 常会 被 互 
斥 量 引 用 所 调用 ， 并 且 元 数 必须 返回 (只 能 返回 ) 一 个 值 ， 在 (bool)pred() 评 估 后 返回 true， 或 在 
指定 时 间 relative time 内 完成 。 线 程 阻塞 的 时 间 就 要 比 指定 的 时 间 长 了 。 在 有 这 样 可 能 性 的 地 
方 ， 流 逝 的 时 间 是 由 稳定 时 钟 决定 。 


抛 出 
当 效 果 没 有 达成 时 ， 会 抛 出 std: :system_error 异常 或 者 由 pred 抛 出 任意 异常 9 


同步 
std::condition_variable_any 实例 中 的 notify_one(),notify_all(),wait(),wait_for() 和 wait_until() 
都 是 序列 化 函数 ( 串 行 调用 )。 调 用 notify_one() 或 notify_all() 只 能 唤醒 正在 等 待 中 的 线程 。 


std::condition_variable_any::wait_until =X i 4% 


std::condition_variable_any 在 调用 notify one()、 调 用 notify_all()、 指 定时 间 内 达成 条 件 或 线 
程 伪 唤 醒 时 ， 结 束 等 待 


声明 


template<typename Lockable,typename Clock,typename Duration> 
std::cv_status wait_until( 

Lockable& lock, 

std::chrono::time_point<Clock, Duration> const& 
absolute_time); 


先决 条 件 
Lockable 类 型 需要 能 够 上 锁 ，lock 对 象 拥 有 一 个 锁 。 


当 其 他 线程 调用 notify_one() 或 notify_all() 函 数 ， 或 Clock::now() 返 回 一 个 大 于 或 等 于 
absolute time 的 时 间 ， 亦 或 线程 伪 唤 醒 ，lock 都 将 自动 解锁 ， 并 且 唤 醒 阻塞 的 线程 。 在 
wait_until() 返 回 之 前 lock 对 象 会 再 次 上 人 锁 。 

返回 

2% 42 #notify_one() ` notify_all() X M KHL k Et » Zi Elstd::cv_status::no_timeout ; 反之 ， 


则 返回 std: :CV_Status: :timeout ° 
抛 出 


当 效 果 没 有 达成 的 时 候 ， 会 抛 出 std::system_error 异常 。 当 lock 对 象 在 调用 wait_ for() 函 数 前 
解锁 ， 那 么 lock 对 象 会 在 wait for() 退 出 前 再 次 上 锁 ， 即 使 函数 是 以 弄 常 的 方式 退出 。 


NOTE: 伪 唤醒 意味 着 一 个 线程 调用 wait() 后 ， 在 没有 其 他 线程 调用 notify_one() 或 notify_all() 

时 ， 还 处 以 苏醒 状态 。 因 此 ， 这 里 建议 重 载 wait_Uuntil() 函 数 ， 重 载 函 数 可 以 使 用 谓词 。 要 不 ， 
则 建议 wait_until() 使 用 循环 的 方式 对 与 谓词 相关 的 条 件 变 量 进 行 检查 。 这 里 不 保证 线程 会 被 阻 
塞 多 长 时 间 ， 只 有 当 函 数 返回 false 后 (Clock::now() 的 返回 值 大 于 或 等 于 absolute time)， 线 程 
才能 解除 阻塞 。 

同步 std::condition_variable_any 实例 中 的 notify_one(),notify_all(),wait(),wait_for() 和 
wait_until() 都 是 序列 化 函数 ( 串 行 调用 )。 调 用 notify_one() 或 notify_all() 只 能 唤醒 正在 等 待 中 的 
线程 。 


std::condition_variable_any::wait_unti 需要 一 个 谓词 的 成 员 


std::condition_variable_any 在 调用 notify_one()、 调 用 notify_all()、 谓 词 返回 true 或 指定 时 间 
内 达到 条 件 ， 结 束 等 待 。 


声明 


template<typename Lockable,typename Clock, 
typename Duration, typename Predicate> 

bool wait_until( 
Lockable& lock, 
std::chrono: :time_point<Clock, Duration> const& 


absolute_time, 
Predicate pred); 


先决 条 件 
pred() 必 须 是 合法 的 ， 并 且 其 返回 值 能 转换 为 bool 值 。 当 线程 调用 wait() 即 可 获得 锁 的 所 有 


权 ,lock.owns_lock() 必 须 为 true。 


效果 
等 价 于 


while(!pred()) 
{ 


if(wait_until(lock,absolute_time)==std::cv_status::timeout) 
return pred(); 


} 


return true; 


返回 
当 调 用 pred() 返 回 true 时 ， 返 回 true ; 当 Clock::now() 的 时 间 大 于 或 等 于 指定 的 时 间 
absolute time， 并 且 pred() 返 回 false 时 ， 返 回 false ° 


NOTE : 潜在 的 伪 唤 醒 意 味 着 不 会 指定 pred 调 用 的 次 数 。 通 过 lock 进 行 上 锁 ，pred 经 常会 被 互 
斥 量 引用 所 调用 ， 并 且 骂 数 必须 返回 (只 能 返回 ) 一 个 值 ， 在 (bool)pred() 评 估 后 返回 true， 或 

Clock::now() 返 回 的 时 间 大 于 或 等 于 absolute time。 这 里 不 保证 调用 线程 将 被 阻塞 的 时 长 ， 只 
有 当 函 数 返 回 false 后 (Clock::now() 返 回 一 个 等 于 或 大 于 absolute _ time 的 值 )， 线 程 接触 阻塞 。 


抛 出 
当 效 果 没 有 达成 时 ， 会 抛 出 std: :system_error 异常 或 者 由 pred 抛 出 任意 异常 9 


同步 
std::condition_variable_any 实例 中 的 notify_one(),notify_all(),wait(),wait_for() 和 wait_until() 
都 是 序列 化 函数 ( 串 行 调用 )。 调 用 notify_one() 或 notify_all() 只 能 唤醒 正在 等 待 中 的 线程 。 


D.3 <atomic> 头 文件 


<atomic> 头 文件 提供 一 组 基础 的 原子 类 型 ， 和 提供 对 这 些 基 本 类 


板 函 数 ， 用 来 接收 用 户 定义 的 类 型 ， 以 适用 于 某 些 标准 。 
头 文件 内 容 


#define ATOMIC_BOOL_LOCK_FREE 参见 详 述 
#define ATOMIC_CHAR_LOCK_FREE 参见 详 述 
#define ATOMIC_SHORT_LOCK_FREE 参见 详 述 
#define ATOMIC_INT_LOCK_FREE 参见 详 述 
#define ATOMIC_LONG_LOCK_FREE 参见 详 述 
#define ATOMIC_LLONG_LOCK_FREE 参见 详 述 
#define ATOMIC_CHAR16_T_LOCK_FREE 参见 详 述 
#define ATOMIC_CHAR32_T_LOCK_FREE 参见 详 述 
#define ATOMIC WCHAR_T_LOCK_FREE Pn 
#define ATOMIC_POINTER_LOCK_FREE 参见 详 
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#define ATOMIC_VAR_INIT(value) 参见 详 述 
namespace std 
{ 


enum memory_order; 
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详 述 atomic_bool; 

义 详 述 atomic_char; 

Fak atomic char16 七 
Fak atomic_char32_t; 
ut atomic_schar; 
义 详 述 atomic_uchar; 
Fak atomic_short; 
Fak atomic_ushort; 
if xt atomic_int; 

义 详 述 atomic_uint; 
详 述 atomic_long; 


t+ atomic_ulong; 


Fat atomic_llong; 


型 的 操作 ， 以 及 一 个 原子 模 


参见 类 型 定义 详 述 atomic_ullong; 
参见 类 型 定义 详 述 atomic_wchar_t; 


t atomic_int_least8_t; 
t atomic_uint_least8_t; 
t atomic_int_leasti6_t; 
t atomic_uint_leasti6_t; 
详 述 atomic_int_least32_t; 
详 述 atomic_uint_least32_t; 
t atomic_int_least64_t; 
详 述 atomic_uint_least64_t; 
详 述 atomic_int_fast8_t; 
t atomic_uint_fast8_t; 
t atomic_int_fast1i6_t; 
详 述 atomic_uint_fast16_t; 
t atomic_int_fast32_t; 
详 述 atomic_uint_fast32_t; 
详 述 atomic_int_fast64_t; 
atomic_uint_fast64_t; 
it atomic_int8_t; 

详 述 atomic_uint8_t; 

详 述 atomic_int16 tt， 

详 述 atomic_uinti6_t; 

详 述 atomic_int32_t; 

详 述 atomic_uint32_t; 

t atomic_int64_t; 

详 述 atomic_uint64_t; 

t atomic_intptr_t; 

详 述 atomic_uintptr_t; 

详 述 atomic_size_t; 

详 述 atomic_ssize_t; 

详 述 atomic_ptrdiff_t; 

详 述 atomic_intmax_t; 
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详 述 atomic_uintmax_t; 


template<typename T> 
struct atomic; 


extern "C" void atomic_thread_fence(memory_order order); 
extern "C" void atomic_signal_fence(memory_order order); 


template<typename T> 
T kill_dependency(T); 


std::atomic xxx 类 型 定义 


为 了 兼容 新 的 C 标 准 (C11) ，C++ 支 持 定义 原子 整 型 类 型 。 这 些 类 型 都 与 std::atimic<T>; 特 化 
类 相对 应 ， 或 是 用 同一 接口 特 化 的 一 个 基本 类 型 。 


Table D.1 原子 类 型 定义 和 与 之 相关 的 std::atmoic<> 特 化 模板 


std::atomic_itype 原子 类 型 std::atomic<> 相关 特 化 类 
atomic_char std::atomic<char> 
atomic_schar std::atomic<signed char> 
atomic_uchar std::atomic<unsigned char> 
atomic_int std::atomic<int> 
atomic_uint std::atomic<unsigned> 
atomic_short std::atomic<short> 
atomic_ushort std::atomic<unsigned short> 
atomic_long std::atomic<long> 
atomic_ulong std::atomic<unsigned long> 
atomic_llong std::atomic<long long> 
atomic_ullong std::atomic<unsigned long long> 
atomic_wchar_t std::atomic<wchar_t> 
atomic_char16 t std::atomic<char16_t> 
atomic_char32_t std::atomic<char32_t> 


( 译 者 注 : 该 表 与 第 5 章 中 的 表 5.1 几 乎 一 致 ) 


D.3.2 ATOMIC_xxx_LOCK_FREE 安 


这 里 的 宏 指 定 了 原子 类 型 与 其 内 置 类 型 是 否 是 无 锁 的 。 


ATOMIC_BOOL_LOCK_FREE 参见 详 述 








见 详 述 


ATOMIC_LONG_LOCK_FREE 参见 详 述 





ATOMIC_LLONG_LOCK_FREE 参见 详 述 
ATOMIC_CHAR16_T_LOCK_FREE 参见 详 述 
ATOMIC_CHAR32_T_LOCK_FREE 参见 详 述 


#define 

#define ATOMIC_CHAR_LOCK_FREE# W iý it 
#define ATOMIC_SHORT_LOCK_FREE 参见 
#define ATOMIC_INT_LOCK_FREE 参见 详 述 
#define 

#define 

#define 

#define 

#define 

#define 


ATOMIC_xxx_LOCK_FREE 的 值 无 非 就 是 0，1， 


是 有 锁 的 ; 1 意味 着 ， 操 作 只 


ATOMIC_WCHAR_T_LOCK_FREE ee 
ATOMIC_POINTER_LOCK_FREE 参见 详 


对 一 些 特 定 的 类 型 上 锁 


的 类 型 不 上 倘 


2。0 意 味 着 ， 在 对 有 无 符号 的 相关 原子 类 型 操作 
> 而 对 没有 指定 


; 2m 


着 ， 所 有 操作 都 是 无 锁 的 。 例 如 ， 当 ATOMIC INT LOCK FREE 是 2 的 时 候 ， 


在 std: :atomic&lt;int&gt; 


Æ ATOMIC_POINTER_LOCK_FREE 描述 了 


~ 


TE 


和 std: :atomic&lt;unsigned&gt; 


D.3.3 ATOMIC_VAR _INIT 安 


ATOMIC_VAR_INIT 宏 可 以 通过 一 个 特定 的 值 来 初始 化 一 个 原子 变量 。 


声明 #define ATOMIC_VAR_INIT(value ) 参 见 详 述 


宏 可 以 扩展 成 一 系列 符号 ，i 
如 下 所 示 : 


std: :atomic<type> x 


给 定 值 可 以 兼容 与 原子 变量 相关 的 非 原子 变量 


这 个 宏 可 以 通 


一 个 给 定 值 


= ATOMIC_VAR_INIT(val); 


> 例如 : 


= ATOMIC_VAR_INIT(42); 


， 对 于 特 化 的 原子 类 型 指针 sta: 


上 的 操作 始终 无 锁 。 


:atomic<T*> 操作 的 无 锁 


， 初始 化 一 个 标准 原子 类 型 ， 表 达 式 


std::atomic&lt;int> i 

std::string S; 

std: :atomic&lt;std::string*> p 
这 样 初 始 化 的 变量 是 非 原子 的 ， 并 且 在 变量 


= ATOMIC_VAR_INIT(&S ) ; 


初始 化 之 后 ， 


这 样 可 以 避免 条 件 竞 争 和 未 定义 行为 的 发 生 。 


其 他 线程 可 以 随意 的 访问 该 变量 


’ 


D.3.4 OU 
std::memory_order 枚 举 类 型 用 来 表明 原子 操作 的 约束 顺序 。 
声明 


typedef enum memory_order 


i 


memory_order_relaxed, memory_order_consume, 

memory_order_acquire,memory_order_release, 

memory_order_acq_rel,memory_order_seq_cst 
} memory_order; 


通过 标记 各 种 内 存 序 变量 来 标记 操作 的 顺序 ( 详 见 第 5 章 ， 在 该 章节 中 有 对 书 序 约束 更 加 详尽 的 
介绍 ) 
std::memory_order_relaxed 


操作 不 受 任何 额外 的 限制 。 


std::memory_order_release 


对 于 指定 位 置 上 的 内 存 可 进行 释放 操作 。 因 此 ， 与 获取 操作 读 取 同一 内 存 位 置 所 存储 的 值 。 


std::memory_order_acquire 

操作 可 以 获取 指定 内 存 位 置 上 的 值 。 当 需要 存储 的 值 通过 释放 操作 写 入 时 ， 是 与 存储 操 同 步 
的 。 

std::memory_order_acq_rel 

操作 必须 是 “ 读 - 改 - 写 " 操 作 ， 并 且 其 行为 需要 

在 std: :memory_order_acquire 和 std: :memory_order_release 序 指定 的 内 存 位 置 上 进行 操作 2 
std::memory_order_seq_cst 


操作 在 全 局 序 上 都 会 受到 约束 。 还 有 ， 当 为 存储 操作 时 ， 其 行为 好 
比 std::memory_order_release 操作 ; 当 为 加 载 操 作 时 ， 其 行为 好 
比 std::memory_order_acquire 操作 ; 并 且 ， 当 其 是 一 个 “ 读 - 改 - 写 " 操 作 时 ， 其 行为 


和 std: :memory_order_acquire 和 std: :memory_order_release 类 似 。 对 于 所 有 顺序 来 说 > MH 
序 为 默认 序 。 


std::memory_order_consume 


对 于 指定 位 置 的 内 存 进行 消耗 操作 (consume operation) 。 


( 译 者 注 : 与 memory_order_acquire 类 似 ) 


D.3.5 std::atomic_thread_fence % žx 


std: :atomic_thread_fence() 会 在 代码 中 插 入 “内 存 栅栏 " ， 强 制 两 个 操作 保持 内 存 约 束 顺序 


声明 


extern "C" void atomic_thread_fence(std::memory_order order); 


插入 栅栏 的 目的 是 为 了 保证 内 存 序 的 约束 性 。 


栅栏 使 用 std: :memory_order_release , std::memory_order_acq_rel , 或 
std::memory_order_seq_cst 内 存 序 ， 会 同 步 与 一 些 内 存 位 置 上 的 获取 操作 进行 同 步 ， 如 果 这 
些 获取 操作 要 获取 一 个 已 存储 的 值 (通过 原子 操作 进行 的 存储 )， 就 会 通过 栅栏 进行 同步 。 


释放 操作 可 对 std: :memory_order_acquire , std::memory_order_acq_rel , 或 
std: :memory_order_seq_cst 进行 栅栏 同 步 > 3 当 释放 操作 存储 的 值 ， 在 一 个 原 子 操作 之 前 读 
取 ， 那 么 就 会 通过 栅栏 进行 同步 。 


抛 出 
无 


D.3.6 std::atomic_signal_fence % žr 


std: :atomic_signal_fence() 会 在 代码 中 插入 “内 存 栅 栏 *， 强 制 两 个 操作 保持 内 存 约束 顺序 ， 
并 且 在 对 应 线程 上 执行 信号 处 理 操作 。 


声明 


extern "C" void atomic_signal_fence(std::memory_order order); 


效果 
根据 需要 的 内 存 约束 序 插入 一 个 栅栏 。 除 非 约束 序 应 用 于 “操作 和 信号 处 理 函 数 在 同一 线程 "的 
情况 下 > 否则， 这 个 操作 等 价 于 std: :atomic_thread_fence(order ) 操作 © 


抛 出 
无 


D.3.7 std::atomic flag 关 

std::atomic flag 类 算是 原子 标识 的 骨架 。 在 C++11 标 准 下 ， 只 有 这 个 数据 类 型 可 以 保证 是 
无 锁 的 (当然 ， 更 多 的 原子 类 型 在 未 来 的 实现 中 将 采取 无 锁 实 现 )。 

对 于 一 个 std::atomic_flag 来 说 ， 其 状态 不 是 set， 就 是 clear。 


类 型 定义 


struct atomic_flag 
{ 
atomic_flag() noexcept = default; 
atomic_flag(const atomic_flag&) = delete; 
atomic_flag& operator=(const atomic_flag&) = delete; 
atomic_flag& operator=(const atomic_flag&) volatile = delete; 


bool test_and_set(memory_order = memory_order_seq_cst) 

volatile 
noexcept; 

bool test_and_set(memory_order = memory_order_seq_cst) 
noexcept; 

void clear(memory_order = memory_order_seq_cst) volatile 
noexcept,; 

void clear(memory_order = memory_order_seq_cst) noexcept; 


}; 


bool atomic_flag_test_and_set(volatile atomic flag*) noexcept; 





bool atomic_flag_test_and_set(atomic_flag*) noexcept; 





bool atomic_flag_test_and_set_explicit( 





volatile atomic_flag*, memory_order) noexcept; 
bool atomic_flag_test_and_set_explicit( 





atomic_flag*, memory_order) noexcept; 
void atomic_flag_clear(volatile atomic_flag*) noexcept; 
void atomic_flag_clear(atomic_flag*) noexcept; 
void atomic_flag_clear_explicit( 
volatile atomic_flag*, memory_order) noexcept; 
void atomic_flag_clear_explicit( 
atomic_flag*, memory_order) noexcept; 


#define ATOMIC_FLAG_INIT unspecified 


std::atomic_flag 默认 构造 函数 


这 里 未 章 定 默认 构造 出 来 的 std::atomic fladg 实例 是 clear 状 态 ， 还 是 Set 状态 。 因 为 对 象 存储 
过 程 是 静态 的 ， 所 以 初始 化 必须 是 静态 的 。 


声明 


std::atomic flag() noexcept = default; 


构造 一 个 新 std::atomic_flag 对 象 ， 不 过 未 指明 状态 。( 和 薛 定 请 的 猫 ? ) 
抛 出 
无 


std::atomic_flag 使 用 ATOMIC_FLAG _INIT 进 行 初始 化 


std::atomic_flag 实例 可 以 使 用 ATOMIC_FLAG_INIT 宏 进 行 创建 ， 这 样 构造 出 来 的 实例 状态 为 
须 是 


clear。 因 为 对 象 存 储 过 程 是 静态 的 ， 所 以 初始 化 必须 


声明 
#define ATOMIC FLAG INIT unspecified 
用 法 


std: :atomic flag flag=ATOMIC_FLAG_INIT; 
构造 一 个 新 std: :atomic_flag 对 象 ， 状 态 为 clear。 


抛 出 
无 


NOTE: 对 于 内 存 位 置 上 的 *this， 这 个 操作 属于 “ 读 - 改 - 写 " 操 作 。 
std::atomic_flag::test_and_set 7% i $% žk 
自动 设置 实例 状态 标识 ， 并 且 检 查实 例 的 状态 标识 是 否 已 经 设置 。 


声明 


bool atomic_flag_test_and_set(volatile atomic_flag* flag) 





noexcept; 
bool atomic_flag_test_and_set(atomic_flag* flag) noexcept; 





效果 


return flag->test_and_set(); 


std::atomic_flag_test_and_set 72% i HA 


自动 设置 原子 变量 的 状态 标识 ， 并 且 检查 原子 变量 的 状态 标识 是 否 已 经 设置 。 


声明 


bool atomic_flag_test_and_set_explicit( 





volatile atomic_flag* flag, memory_order order) noexcept; 
bool atomic_flag_test_and_set_explicit( 





atomic_flag* flag, memory_order order) noexcept; 


return flag->test_and_set(order); 


à 


std::atomic_flag_test_and_set_explicit 72% i BA 
自动 设置 原子 变量 的 状态 标识 ， 并 且 检查 原子 变量 的 状态 标识 是 否 已 经 设置 。 


声明 





bool atomic_flag_test_and_set_explicit( 


volatile atomic_flag* flag, memory_order order) noexcept; 
bool atomic_flag_test_and_set_explicit( 


atomic_flag* flag, memory_order order) noexcept; 





效果 
return flag->test_and_set(order); 
std::atomic_flag::clear % i $ 2& 


自动 清除 原子 变量 的 状态 标识 。 


声明 


void clear(memory_order order = memory_order_seq_cst) volatile 
noexcept; 
void clear(memory_order order = memory_order_seq_cst) noexcept; 


先决 条 件 
支持 std::memory_order_relaxed , std::memory_order_release 和 std: :memory_order_seq_cst 中 
任意 一 个 。 


效果 


自动 清除 变量 状态 标识 。 


抛 出 
无 


NOTE: 对 于 内 存 位 置 上 的 *this， 这 个 操作 属于 “ 写 "操作 (存储 操作 )。 
std::atomic_flag_clear #5 R it 4 žr 
自动 清除 原子 变量 的 状态 标识 。 


声明 


void atomic_flag_clear(volatile atomic_flag* flag) noexcept; 
void atomic_flag_clear(atomic_flag* flag) noexcept; 


效果 


flag->clear(); 


std::atomic_flag_clear_explicit 7% i $% žk 
自动 清除 原子 变量 的 状态 标识 。 
声明 
void atomic_flag_clear_explicit( 
volatile atomic_flag* flag, memory_order order) noexcept; 


void atomic_flag_clear_explicit( 
atomic_flag* flag, memory_order order) noexcept; 


效果 


return flag->clear(order); 


D.3.8 std::atomic 类 型 模板 


std::atomic 提供 了 对 任意 类 型 的 原子 操作 的 包装 ， 以 满足 下 面 的 需求 。 
模板 参数 BaseType 必 须 满足 下 面 的 条 件 。 


o 具有 简单 的 默认 构造 函数 
o 具有 简单 的 拷贝 赋值 操作 
o 具有 简单 的 析 构 函数 

o 可 以 进行 位 比较 


这 就 意味 着 std: :atomic&lt;some-simple-struct&gt; 会 和 使 用 std: :atomic<some-built-in- 
type> 一 样 简单 ; 不 过 对 于 std: :atomic<std: :string> 就 不 同 了 。 


除了 主 模板 ， 对 于 内 置 整 型 和 指针 的 特 化 ， 模 板 也 支持 类 似 X++ 这 样 的 操作 。 


std::atomic 实例 是 不 支持 CopyConstructible (拷贝 构 造 ) 和 CopyAssignable (拷贝 赋值 ) ， 原 
你 懂得 ， 因 为 这 样 原子 操作 就 无 法 执行 。 


f2 


类 型 定义 
template<typename BaseType> 
struct atomic 
{ 
atomic() noexcept = default; 
constexpr atomic(BaseType) noexcept; 
BaseType operator=(BaseType) volatile noexcept; 
BaseType operator=(BaseType) noexcept; 


atomic(const atomic&) = delete; 
atomic& operator=(const atomic&) = delete; 
atomic& operator=(const atomic&) volatile = delete; 


bool is_lock_free() const volatile noexcept; 
bool is_lock_free() const noexcept; 


void store(BaseType,memory_order = memory_order_seq_cst) 
volatile noexcept; 
void store(BaseType, memory_order = memory_order_seq_cst) 


noexcept; 
BaseType load(memory_order = memory_order_seq_cst) 
const volatile noexcept; 
BaseType load(memory_order = memory_order_seq_cst) const 
noexcept; 


BaseType exchange(BaseType, memory_order 
memory_order_seq_cst) 
volatile noexcept; 


BaseType exchange(BaseType, memory_order 
memory_order_seq_cst) 
noexcept; 


bool compare_exchange_strong( 
BaseType & old_value, BaseType new_value, 
memory_order order = memory_order_seq_cst) volatile 
noexcept; 
bool compare_exchange_strong( 
BaseType & old_value, BaseType new_value, 
memory_order order = memory_order_seq_cst) noexcept; 
bool compare_exchange_strong( 
BaseType & old_value, BaseType new_value, 
memory_order success_order, 
memory_order failure_order) volatile noexcept; 
bool compare_exchange_strong( 
BaseType & old_value, BaseType new_value, 
memory_order success_order, 
memory_order failure_order) noexcept; 
bool compare_exchange_weak ( 
BaseType & old_value, BaseType new_value, 
memory_order order = memory_order_seq_cst) 
volatile noexcept; 
bool compare_exchange_weak ( 
BaseType & old_value, BaseType new_value, 
memory_order order = memory_order_seq_cst) noexcept; 
bool compare_exchange_weak ( 
BaseType & old_value, BaseType new_value, 
memory _order success_order, 
memory_order failure_order) volatile noexcept; 
bool compare_exchange_weak ( 
BaseType & old_value, BaseType new_value, 


memory_order success_order, 

memory_order failure_order) noexcept; 
operator BaseType () const volatile noexcept; 
operator BaseType () const noexcept; 


】 


template<typename BaseType> 
bool atomic_is_lock_free(volatile const atomic<BaseType>* ) 
noexcept; 
template<typename BaseType> 
bool atomic_is_lock_free(const atomic<BaseType>*) noexcept; 
template<typename BaseType> 
void atomic_init(volatile atomic<BaseType>*, void*) noexcept; 
template<typename BaseType> 
void atomic_init(atomic<BaseType>*, void*) noexcept; 
template<typename BaseType> 
BaseType atomic_exchange(volatile atomic<BaseType>*, 
memory_order ) 

noexcept; 
template<typename BaseType> 
BaseType atomic_exchange(atomic<BaseType>*, memory_order) 
noexcept; 
template<typename BaseType> 
BaseType atomic_exchange_explicit( 

volatile atomic<BaseType>*, memory_order) noexcept; 
template<typename BaseType> 
BaseType atomic_exchange_explicit( 

atomic<BaseType>*, memory_order) noexcept; 
template<typename BaseType> 
void atomic_store(volatile atomic<BaseType>*, BaseType) 
noexcept; 
template<typename BaseType> 
void atomic_store(atomic<BaseType>*, BaseType) noexcept; 
template<typename BaseType> 
void atomic_store_explicit( 

volatile atomic<BaseType>*, BaseType, memory_order) noexcept; 
template<typename BaseType> 
void atomic_store_explicit( 

atomic<BaseType>*, BaseType, memory_order) noexcept; 
template<typename BaseType> 


BaseType atomic_load(volatile const atomic<BaseType>*) noexcept; 
template<typename BaseType> 
BaseType atomic_load(const atomic<BaseType>*) noexcept; 
template<typename BaseType> 
BaseType atomic_load_explicit( 
volatile const atomic<BaseType>*, memory_order) noexcept; 
template<typename BaseType> 
BaseType atomic_load_explicit( 
const atomic<BaseType>*, memory_order) noexcept; 
template<typename BaseType> 
bool atomic_compare_exchange_strong( 
volatile atomic<BaseType>*,BaseType * old value, 
BaseType new_value) noexcept; 
template<typename BaseType> 
bool atomic_compare_exchange_strong( 
atomic<BaseType>*,BaseType * old_value, 
BaseType new_value) noexcept; 
template<typename BaseType> 
bool atomic_compare_exchange_strong_explicit( 
volatile atomic<BaseType>*,BaseType * old value, 
BaseType new_value, memory_order success_order, 
memory_order failure_order) noexcept; 
template<typename BaseType> 
bool atomic_compare_exchange_strong_explicit( 
atomic<BaseType>*,BaseType * old_value, 
BaseType new_value, memory_order success_order, 
memory_order failure_order) noexcept; 
template<typename BaseType> 
bool atomic_compare_exchange_weak( 
volatile atomic<BaseType>*,BaseType * old value, BaseType 
new_value) 
noexcept; 
template<typename BaseType> 
bool atomic_compare_exchange_weak ( 
atomic<BaseType>*,BaseType * old_value, BaseType new_value) 
noexcept; 
template<typename BaseType> 
bool atomic_compare_exchange_weak_explicit( 
volatile atomic<BaseType>*,BaseType * old value, 
BaseType new_value, memory_order success_order, 


memory_order failure_order) noexcept; 
template<typename BaseType> 
bool atomic_compare_exchange_weak_explicit( 
atomic<BaseType>*,BaseType * old_value, 
BaseType new_value, memory_order success_order, 
memory_order failure_order) noexcept; 


NOTE: 哩 然 非 成 员 元 数 通 过 模板 的 方式 指定 ， 不 过 他 们 只 作为 从 在 函数 提供 ， 并 且 对 于 这 些 
欧 数 ， 不 能 显示 的 指定 模板 的 参数 。 

std::atomic 74 32 % žk 

使 用 默认 初始 值 ， 构 造 一 个 std::atomic 实例 。 


声明 


atomic() noexcept; 


使 用 默认 初始 值 ， 构造 一 个 新 std::atomic 实例 。 因 对 象 是 静态 存储 的 ， 所 以 初始 化 过 程 也 是 
静态 的 。 


NOTE: 当 std::atomic 实例 以 非 静 态 方式 初始 化 的 ， 那 么 其 值 就 是 不 可 估计 的 。 
抛 出 
无 
std::atomic_init 非 成 员 有 函数 
std: :atomic<BaseType> 实例 提供 的 值 ， 可 非 原 子 的 进行 存储 2 
声明 
template<typename BaseType> 
void atomic_init(atomic<BaseType> volatile* p, BaseType v) 
noexcept; 


template<typename BaseType> 
void atomic_init(atomic<BaseType>* p, BaseType v) noexcept; 


效果 

将 值 v 以 非 原子 存储 的 方式 ， 存 储 在 *p 中 。 调 用 atomic<BaseType> 实例 中 的 atomic_init()， 这 
里 需要 实例 不 是 默认 构造 出 来 的 ， 或 者 在 构造 出 来 的 时 候 被 执行 了 茶 些 操作 ， 否 则 将 会 引发 
未 定义 行为 。 


NOTE: 因 为 存储 是 非 原 子 的 ， 对 对 象 指针 p 任 意 的 并 发 访问 (即使 是 原子 操作 ) 都 会 引发 数据 竞 
争 o 


抛 出 

无 

std::atomic 转换 构造 函数 

使 用 提供 的 BaseType 值 去 构造 一 个 std::atomic 实例 。 
声明 


constexpr atomic(BaseType b) noexcept; 


效果 
通过 b 值 构造 一 个 新 的 std::atomic 对 象 。 因 对 象 是 静态 存储 的 ， 所 以 初始 化 过 程 也 是 静态 
的 。 


抛 出 
无 


std::atomic 转换 赋值 操作 
在 *this 存 储 一 个 新 值 。 


声明 


BaseType operator=(BaseType b) volatile noexcept; 
BaseType operator=(BaseType b) noexcept; 


效果 


return this->store(b); 


std::atomic::is_lock_free 成 员 有 函数 


确定 对 于 *this 是 否 是 无 锁 操 作 。 


声明 


bool is_lock_free() const volatile noexcept; 
bool is_lock_free() const noexcept; 


返回 

当 操 作 是 无 锁 操作 ， 那 么 就 返回 true， 否 则 返回 false 。 

抛 出 

无 

std::atomic_is_ lock free 72% ih BA 

确定 对 于 *this 是 否 是 无 锁 操 作 。 

声明 
template<typename BaseType> 
bool atomic_is_lock_free(volatile const atomic<BaseType>* p) 
noexcept; 


template<typename BaseType> 
bool atomic_is_lock_free(const atomic<BaseType>* p) noexcept; 


效果 


return p->is_lock_free(); 


std::atomic::load 7% ii $% žr 
原子 的 加 载 std::atomic 实例 当前 的 值 
声明 
BaseType load(memory_order order = memory_order_seq_cst) 
const volatile noexcept; 


BaseType load(memory_order order = memory_order_seq_cst) const 
noexcept; 


先决 条 件 
持 std: :memory_order_relaxed ` std::memory_order_acquire ` std::memory_order_consume 或 


std: :memory_order_seq_cst 内 存 序 9 


效果 
原子 的 加 载 已 存储 到 *this 上 的 值 。 


g 


返回 存储 在 *this 上 的 值 。 


a È mR 
i 


NOTE: 是 对 于 *this 内 存 地 址 原子 加 载 的 操作 。 


std::atomic_load 非 成 员 有 函数 
原子 的 加 载 std::atomic 实例 当前 的 值 。 


声明 


template<typename BaseType> 

BaseType atomic_load(volatile const atomic<BaseType>* p) 
noexcept; 

template<typename BaseType> 

BaseType atomic_load(const atomic<BaseType>* p) noexcept; 


效果 
return p->load(); 
std::atomic_load_explicit 非 成 员 有 函数 


原子 的 加 载 std::atomic 实例 当前 的 值 。 


声明 


template<typename BaseType> 
BaseType atomic_load_explicit( 
volatile const atomic<BaseType>* p, memory_order order) 
noexcept; 
template<typename BaseType> 
BaseType atomic_load_explicit( 
const atomic<BaseType>* p, memory_order order) noexcept; 


效果 


return p->load(order); 


std::atomic::operator BastType 转 换 操作 


加 载 存储 在 *this 中 的 值 。 


声明 


operator BaseType() const volatile noexcept; 
operator BaseType() const noexcept; 


效果 
return this->load(); 
std::atomic::store 成 员 有 函数 


以 原子 操作 的 方式 存储 一 个 新 值 到 atomic<BaseType> 实例 中 。 


声明 


void store(BaseType new_value,memory_order order 
memory_order_seq_cst) 
volatile noexcept; 


void store(BaseType new_value,memory_order order 
memory_order_seq_cst) 
noexcept; 


先决 条 件 
支 


持 std::memory_order_relaxed ` std::memory_order_release 或 std: :memory_order_seq_cst A 


存 序 。 


效果 
将 new_value 原 子 的 存储 到 *this 中 。 


抛 出 
无 


NOTE: 是 对 于 *this 内 存 地 址 原子 加 载 的 操作 。 


std::atomic_store 7% i HA 
以 原子 操作 的 方式 存储 一 个 新 值 到 atomic&lt;BaseTypeagt; 实例 中 。 
声明 
template<typename BaseType> 
void atomic_store(volatile atomic<BaseType>* p, BaseType 
new_value) 
noexcept; 
template<typename BaseType> 


void atomic_store(atomic<BaseType>* p, BaseType new_value) 
noexcept; 


效果 


p->store(new_value); 
std::atomic_explicit 非 成 员 有 子 数 


以 原子 操作 的 方式 存储 一 个 新 值 到 atomic&lt;BaseTypeagt; 实例 中 。 


声明 


template<typename BaseType> 
void atomic_store_explicit( 

volatile atomic<BaseType>* p, BaseType new_value, 
memory_order order) 

noexcept; 
template<typename BaseType> 
void atomic_store_explicit( 

atomic<BaseType>* p, BaseType new_value, memory_order order) 
noexcept; 


效果 


p->store(new_value, order); 


std::atomic::exchange ™ ii & 2% 
原子 的 存储 一 个 新 值 ， 并 读 取 旧 值 。 


声明 


BaseType exchange( 
BaseType new_value, 
memory_order order = memory_order_seq_cst) 
volatile noexcept; 


原子 的 将 new_value 存 储 在 this 中 ， 并 且 取 出 this 中 已 经 存储 的 值 。 


*this 之 前 的 值 。 


NOTE: 这 是 对 *this 内 存 地 址 的 原子 “ 读 - 改 - 写 " 操 作 。 


std::atomic_exchange 非 成 员 有 函数 
原子 的 存储 一 个 新 值 到 atomic<BaseType> 实例 中 ， 并 且 读 取 旧 值 。 


声明 


template<typename BaseType> 
BaseType atomic_exchange(volatile atomic<BaseType>* p, BaseType 
new_value) 

noexcept; 
template<typename BaseType> 
BaseType atomic_exchange(atomic<BaseType>* p, BaseType 
new_value) noexcept; 


效果 


return p->exchange(new_value) ; 


std::atomic_exchange_explicit #6 X ii $% žr 
原子 的 存储 一 个 新 值 到 atomic<Basetype> 实例 中 ， 并 且 读 取 旧 值 。 
声明 
template<typename BaseType> 
BaseType atomic exchange explicit( 
volatile atomic<BaseType>* p, BaseType new_value, 
memory_order order) 
noexcept,; 
template<typename BaseType> 
BaseType atomic_exchange_explicit( 


atomic<BaseType>* p, BaseType new_value, memory_order order) 
noexcept; 


效果 
return p->exchange(new_value, order); 
std::atomic::compare_exchange_strong * i % žk 


当期 望 值 和 新 值 一 样 时 ， 将 新 值 存储 到 实例 中 。 如 果 不 相 等 ， 那 么 就 实用 新 值 更 新 期 望 值 。 


声明 


bool compare_exchange_strong( 

BaseType& expected, BaseType new_value, 

memory_order order = std::memory_order_seq_cst) volatile 
noexcept; 
bool compare_exchange_strong( 

BaseType& expected, BaseType new_value, 

memory_order order = std::memory_order_seq_cst) noexcept; 
bool compare_exchange_strong( 

BaseType& expected, BaseType new_value, 

memory_order success_order,memory_order failure_order) 

volatile noexcept; 
bool compare_exchange_strong( 

BaseType& expected, BaseType new_value, 

memory_order success_order,memory_order failure_order) 
noexcept; 


先决 条 件 

failure_order 不 能 是 std::memory_order_release 或 std::memory_order_acq_rel 内 存 序 。 

将 存储 在 妇 iS 中 的 expected 值 与 new_value 值 进行 逐 位 对 比 ， 当 相等 时 间 new _value 存 储 在 this 
中 ; 否则 ， 更 新 expected 的 值 。 

返回 

当 new_value 的 值 与 *this 中 已 经 存在 的 值 相同 ， 就 返回 true ; 否则 ， 返 回 false 。 


抛 出 
无 


NOTE: 在 success_order==order 和 failure_order==order 的 情况 下 ， 三 个 参数 的 重 载 函数 与 四 
个 参数 的 重 载 函 数 等 价 。 除 非 ，order 是 std::memory_order_acq_rel 时 ，failure_order 
是 std: :memory_order_acquire ， 且 当 order 是 std: :memory_order_release 时 ， failure_order 


是 std: :memory_order_relaxed ° 

NOTE: 当 返回 true 和 success_order 内 存 序 时 ， 是 对 this 内 存 地 址 的 原子 “ 读 - 改 - 写 " 操 作 ; 反 
之 ， 这 是 对 this 内 存 地 址 的 原子 加 载 操作 (failure_orden) ° 
std::atomic_compare_exchange_strong 非 成 员 有 函数 

当期 望 值 和 新 值 一 样 时 ， 将 新 值 存 储 到 实例 中 。 如 果 不 相 等 ， 那 么 就 实用 新 值 更 新 期 望 值 。 


声明 


template<typename BaseType> 
bool atomic_compare_exchange_strong( 


volatile atomic<BaseType>* p,BaseType * old value, BaseType 
new_value) 


noexcept; 
template<typename BaseType> 
bool atomic_compare_exchange_strong( 


atomic<BaseType>* p,BaseType * old value, BaseType new_value) 
noexcept; 


效果 


return p->compare_exchange_strong(*old_value,new value); 


std::atomic_compare_exchange_strong_explicit 非 成 员 有 函数 


当期 望 值 和 新 值 一 样 时 ， 将 新 值 存储 到 实例 中 。 如 果 不 相 等 ， 那 么 就 实用 新 值 更 新 期 望 值 。 


声明 


template<typename BaseType> 

bool atomic_compare_exchange_strong_explicit( 
volatile atomic<BaseType>* p,BaseType * old value, 
BaseType new_value, memory_order success_order, 
memory_order failure_order) noexcept; 

template<typename BaseType> 

bool atomic_compare_exchange_strong_explicit( 
atomic<BaseType>* p,BaseType * old value, 
BaseType new_value, memory_order success_order, 
memory_order failure_order) noexcept; 


效果 


return p->compare_exchange_strong( 


*old_value, new_value, success_order, failure_order) noexcept; 


std::atomic::compare_exchange_weak 成 员 有 函数 


原子 的 比较 新 值 和 期 望 值 ， 如 果 相 等 ， 那 么 存储 新 值 并 且 进 行 原子 化 更 新 。 当 两 值 不 相等 ， 
或 更 新 未 进行 ， 那 期 望 值 会 更 新 为 新 值 。 


声明 


bool compare_exchange_weak ( 

BaseType& expected, BaseType new_value, 

memory_order order = std::memory_order_seq_cst) volatile 
noexcept; 
bool compare_exchange_weak ( 

BaseType& expected, BaseType new_value, 

memory_order order = std::memory_order_seq_cst) noexcept; 
bool compare_exchange_weak ( 

BaseType& expected, BaseType new_value, 

memory_order success_order,memory_order failure_order) 

volatile noexcept; 
bool compare_exchange_weak ( 

BaseType& expected, BaseType new_value, 

memory_order success_order,memory_order failure_order) 
noexcept; 


先决 条 件 
failure_order 不 能 是 std::memory_order_release 或 std::memory_order_acq_rel 内 存 序 。 


将 存储 在 this 中 的 expected 值 与 New_value 值 进行 逐 位 对 比 ， 当 相等 时 间 new_value 存 储 在 this 
中 ; 否则 ， 更 新 expected 的 值 。 


返回 
当 new_value 的 值 与 *this 中 已 经 存在 的 值 相同 ， 就 返回 true ; 否则 ， 返 回 false 。 


抛 出 
无 


NOTE: 在 success_order==order 和 failure_order==order 的 情况 下 ， 三 个 参数 的 重 载 函 数 与 四 
个 参数 的 重 载 函 数 等 价 。 除 非 ，order 是 std::memory_order_acq_rel 时 ，failure_order 
是 std: :memory_order_acquire ， 且 当 order 是 std: :memory_order_release 时 ， failure_order 


是 std: :memory_order_relaxed ° 


NOTE: 当 返回 true 和 success_order 内 存 序 时 ， 是 对 this 内 存 地 址 的 原子 “ 读 - 改 - 写 " 操 作 ; 反 
之 ， 这 是 对 this 内 存 地 址 的 原子 加 载 操 作 (failure_order)。 


std::atomic_compare_exchange_weak 非 成 员 有 函数 


原子 的 比较 新 值 和 期 望 值 ， 如 果 相 等 ， 那 么 存储 新 值 并 且 进 行 原子 化 更 新 。 当 两 值 不 相等 ， 
或 更 新 未 进行 ， 那 期 望 值 会 更 新 为 新 值 。 


声明 


template<typename BaseType> 
bool atomic_compare_exchange_weak( 


volatile atomic<BaseType>* p,BaseType * old value, BaseType 
new_value) 


noexcept; 
template<typename BaseType> 
bool atomic_compare_exchange_weak( 


atomic<BaseType>* p,BaseType * old _ value, BaseType new_value) 
noexcept; 


效果 


return p->compare_exchange_weak(*old_ value, new_value); 


std::atomic_compare_exchange_weak_explicit 非 成 员 有 函数 


原子 的 比较 新 值 和 期 望 值 ， 如 果 相 等 ， 那 么 存储 新 值 并 且 进行 原子 化 更 新 。 当 两 值 不 相等 ， 
或 更 新 未 进行 ， 那 期 望 值 会 更 新 为 新 值 。 


声明 


template<typename BaseType> 

bool atomic_compare_exchange_weak_explicit( 
volatile atomic<BaseType>* p,BaseType * old value, 
BaseType new_value, memory_order success_order, 
memory_order failure_order) noexcept; 

template<typename BaseType> 

bool atomic_compare_exchange_weak_explicit( 
atomic<BaseType>* p,BaseType * old value, 
BaseType new_value, memory_order success_order, 
memory_order failure_order) noexcept; 


效果 


return p->compare_exchange_weak( 
*old_value, new_value, success_order, failure_order); 


D.3.9 std::atomic 模 板 类 型 的 特 化 


std::atomic 类 模板 的 特 化 类 型 有 整 型 和 指针 类 型 。 对 于 整 型 来 说 ， 特 化 模板 提供 原子 加 减 ， 
以 及 位 域 操作 ( 主 模板 未 提供 )。 对 于 指针 类 型 来 说 ， 特 化 模板 提供 原子 指针 的 运算 ( 主 模板 未 
提供 ) 。 


特 化 模板 提供 如 下 整 型 : 


std: :atomic<bool> 

std: :atomic<char> 

std: :atomic<signed char> 
std: :atomic<unsigned char> 
std: :atomic<short> 

std: :atomic<unsigned short> 
std: :atomic<int> 

std: :atomic<unsigned> 

std: :atomic<long> 

std: :atomic<unsigned long> 
std: :atomic<long long> 

std: :atomic<unsigned long long> 
std: :atomic<wchar_t> 

std: :atomic<char1i6_t> 

std: :atomic<char32_t&gt; 


std: :atomic<T*> 原子 指针 ， 可 以 使 用 以 上 的 类 型 作为 T。 


D.3.10 特 化 std::atomic<integral-type> 


std: :atomic&lt;integral-type&gt; 是 为 每 一 个 基础 整 型 提供 的 std::atomic 类 模板 ， 其 中 提 
供 了 一 套 完整 的 整 型 操作 。 


下 面 的 特 化 模板 也 适用 于 std::atomic<> 类 模板 : 


std: :atomic<char> 

std: :atomic<signed char> 
std: :atomic<unsigned char> 
std: :atomic<short> 

std: :atomic<unsigned short> 
std: :atomic<int> 

std: :atomic<unsigned> 

std: :atomic<long> 

std: :atomic<unsigned long> 
std::atomic<long long> 

std: :atomic<unsigned long long> 
std: :atomic<wchar_t> 

std: :atomic<chari6_t> 

std: :atomic<char32_t> 


为 原子 操作 只 能 执行 其 中 一 个 ， 所 以 特 化 模板 的 实例 不 可 copyconstructible (拷贝 构造 ) 
和 copyAssignable (拷贝 赋值 ) o 


类 型 定义 
template<> 
struct atomic<integral-type> 
{ 
atomic() noexcept = default; 
constexpr atomic(integral-type) noexcept; 
bool operator=(integral-type) volatile noexcept; 
atomic(const atomic&) = delete; 
atomic& operator=(const atomic&) = delete; 
atomic& operator=(const atomic&) volatile = delete; 
bool is_lock_free() const volatile noexcept; 
bool is_lock_free() const noexcept; 
void store(integral-type,memory_order = memory_order_seq_cst) 
volatile noexcept; 
void store(integral-type,memory_order = memory_order_seq_cst) 
noexcept; 


integral-type load(memory_order = memory_order_seq_cst) 





const volatile noexcept; 


integral-type load(memory_order = memory_order_seq_cst) const 





noexcept; 
integral-type exchange( 
integral-type,memory_order = memory_order_seq_cst) 
volatile noexcept; 
integral-type exchange( 
integral-type,memory_order = memory_order_seq_cst) 
noexcept; 


bool compare_exchange_strong( 
integral-type & old_value, integral-type new_value, 
memory_order order = memory_order_seq_cst) volatile 
noexcept; 
bool compare_exchange_strong( 
integral-type & old_value, integral-type new_value, 
memory_order order = memory_order_seq_cst) noexcept; 
bool compare_exchange_strong( 
integral-type & old_value, integral-type new_value, 
memory_order success_order,memory_order failure_order) 
volatile noexcept; 
bool compare_exchange_strong( 
integral-type & old_value, integral-type new_value, 
memory_order success_order,memory_order failure_order) 
noexcept; 
bool compare_exchange_weak ( 
integral-type & old_value, integral-type new_value, 
memory_order order = memory_order_seq_cst) volatile 
noexcept; 
bool compare_exchange_weak ( 
integral-type & old_value, integral-type new_value, 
memory_order order = memory_order_seq_cst) noexcept; 
bool compare_exchange_weak ( 
integral-type & old_value,integral-type new_value, 
memory_order success_order,memory_order failure_order) 
volatile noexcept; 
bool compare_exchange_weak ( 
integral-type & old_value,integral-type new_value, 
memory_order success_order,memory_order failure_order) 
noexcept; 


operator integral-type() const 
operator integral-type() const 


integral-type fetch_add( 
integral-type, memory_order 
volatile noexcept; 
integral-type fetch_add( 
integral-type, memory_order 
noexcept; 
integral-type fetch_sub( 
integral-type, memory_order 
volatile noexcept; 
integral-type fetch_sub( 
integral-type,memory_order 
noexcept; 
integral-type fetch_and( 
integral-type, memory_order 
volatile noexcept; 
integral-type fetch_and( 
integral-type,memory_order 
noexcept; 
integral-type fetch_or( 
integral-type, memory_order 
volatile noexcept; 
integral-type fetch_or( 
integral-type,memory_order 
noexcept; 
integral-type fetch_xor( 
integral-type, memory_order 
volatile noexcept; 
integral-type fetch_xor( 
integral-type,memory_order 
noexcept; 


volatile noexcept; 
noexcept; 


= memory_order_seq_cst) 


= memory_order_seq_cst) 


= memory_order_seq_cst) 


= memory_order_seq_cst) 


= memory_order_seq_cst) 


= memory_order_seq_cst) 


= memory_order_seq_cst) 


= memory_order_seq_cst) 


= memory_order_seq_cst ) 


= memory_order_seq_cst) 


integral-type operator++() volatile noexcept; 


integral-type operator++() noexcept; 


integral-type operator++(int) volatile noexcept; 


integral-type operator++(int) noexcept; 


integral-type operator--() volatile noexcept; 


integral-type operator--() noexcept; 


integral-type operator--(int) volatile noexcept; 
integral-type operator--(int) noexcept; 

integral-type operator+=(integral-type) volatile noexcept; 
integral-type operator+=(integral-type) noexcept; 
integral-type operator-=(integral-type) volatile noexcept; 
integral-type operator-=(integral-type) noexcept; 
integral-type operator&=(integral-type) volatile noexcept; 
integral-type operator&=(integral-type) noexcept; 
integral-type operator |=(integral-type) volatile noexcept; 
integral-type operator |=(integral-type) noexcept; 
integral-type operator/4=(integral-type) volatile noexcept; 
integral-type operator4=(integral-type) noexcept; 


ar 


bool atomic_is_lock_free(volatile const atomic<integral-type>* ) 
noexcept; 
bool atomic_is_lock_free(const atomic<integral-type>*) noexcept; 
void atomic_init(volatile atomic<integral-type>*, integral-type) 
noexcept; 
void atomic_init(atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic_exchange( 
volatile atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic_exchange( 
atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic_exchange_explicit ( 
volatile atomic<integral-type>*,integral-type, memory_order) 
noexcept; 
integral-type atomic_exchange_explicit ( 
atomic<integral-type>*,integral-type, memory_order) 
noexcept; 
void atomic_store(volatile atomic<integral-type>*, integral-type) 
noexcept; 
void atomic_store(atomic<integral-type>*, integral-type) 
noexcept; 
void atomic_store_explicit( 
volatile atomic<integral-type>*,integral-type, memory_order) 
noexcept; 
void atomic_store_explicit( 
atomic<integral-type>*,integral-type, memory_order) 
noexcept; 


integral-type atomic_load(volatile const atomic<integral-type>* ) 
noexcept; 
integral-type atomic_load(const atomic<integral-type>* ) 
noexcept; 
integral-type atomic_load_explicit( 
volatile const atomic<integral-type>*,memory_order ) 
noexcept; 
integral-type atomic_load_explicit( 
const atomic<integral-type>*,memory_order) noexcept; 
bool atomic_compare_exchange_strong( 
volatile atomic<integral-type>*, 
integral-type * old_value, integral-type new_value) noexcept; 
bool atomic_compare_exchange_strong( 
atomic<integral-type>*, 
integral-type * old_value, integral-type new_value) noexcept; 
bool atomic_compare_exchange_strong_explicit( 
volatile atomic<integral-type>*, 
integral-type * old value, integral-type new_value, 
memory_order success_order,memory_order failure_order) 
noexcept; 
bool atomic_compare_exchange_strong_explicit( 
atomic<integral-type>*, 
integral-type * old value, integral-type new_value, 
memory_order success_order,memory_order failure_order) 
noexcept; 
bool atomic_compare_exchange_weak( 
volatile atomic<integral-type>*, 
integral-type * old_value,integral-type new_value) noexcept; 
bool atomic_compare_exchange_weak( 
atomic<integral-type>*, 
integral-type * old_value, integral-type new_value) noexcept; 
bool atomic_compare_exchange_weak_explicit( 
volatile atomic<integral-type>*, 
integral-type * old value, integral-type new_value, 
memory_order success_order,memory_order failure_order) 
noexcept; 
bool atomic_compare_exchange_weak_explicit( 
atomic<integral-type>*, 
integral-type * old value, integral-type new_value, 
memory_order success_order,memory_order failure_order) 


noexcept; 


integral-type atomic_fetch_add( 
volatile atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic_fetch_add( 
atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic_fetch_add_explicit( 
volatile atomic<integral-type>*,integral-type, memory_order) 
noexcept; 
integral-type atomic_fetch_add_explicit( 
atomic<integral-type>*,integral-type, memory_order) 
noexcept; 
integral-type atomic_fetch_sub/( 
volatile atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic_fetch_sub/( 
atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic_fetch_sub_explicit( 
volatile atomic<integral-type>*,integral-type, memory_order) 
noexcept; 
integral-type atomic_fetch_sub_explicit( 
atomic<integral-type>*,integral-type, memory_order) 
noexcept; 
integral-type atomic_fetch_and( 
volatile atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic_fetch_and( 
atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic_fetch_and_explicit( 
volatile atomic<integral-type>*,integral-type, memory_order) 
noexcept; 
integral-type atomic_fetch_and_explicit( 
atomic<integral-type>*,integral-type, memory_order) 
noexcept; 
integral-type atomic_fetch_or( 
volatile atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic_fetch_or( 
atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic_fetch_or_explicit( 
volatile atomic<integral-type>*,integral-type, memory_order) 
noexcept; 
integral-type atomic_fetch_or_explicit( 


atomic<integral-type>*,integral-type, 
noexcept; 
integral-type atomic_fetch_xor( 


memory_order ) 


volatile atomic<integral-type>*,integral-type) noexcept; 


integral-type atomic_fetch_xor( 


atomic<integral-type>*,integral-type) noexcept; 


integral-type atomic_fetch_xor_explicit( 


volatile atomic<integral-type>*,integral-type, memory_order) 


noexcept; 

integral-type atomic_fetch_xor_explicit( 
atomic<integral-type>*,integral-type, 

noexcept; 


些 操作 在 主 模板 中 也 有 提供 ( 见 D.3.8) © 


memory_order ) 


std::atomic<integral-type>::fetch_add 成 员 函 数 


原子 的 加 载 一 个 值 ， 然 后 使 用 与 提供 ji 相 加 的 结果 ， 替 换 掉 原 值 。 


声明 


integral-type fetch_add( 


integral-type i,memory_order order = memory_order_seq_cst) 


volatile noexcept; 
integral-type fetch_add( 


integral-type i,memory_order order = memory_order_seq_cst) 


noexcept; 


原子 的 查询 this 中 的 值 ， 将 old-valuet+ti 的 和 存 回 this。 


aj 
*this 之 前 存储 的 值 。 


站 入 贷 贷 
tf g 


NOTE: 对 于 *this 的 内 存 地 址 来 说 ， 这 是 一 个 “" 读 - 改 - 写 ?操作 。 


std::atomic_fetch_add JF i HA 


从 atomic<integral-type> 实例 中 原子 的 读 取 一 个 值 ， 并 且 将 其 


与 给 定 ij 值 相 加 ， 替 换 原 值 。 


声明 


integral-type atomic_fetch_add( 

volatile atomic<integral-type>* p, integral-type i) 
noexcept; 
integral-type atomic_fetch_add( 

atomic<integral-type>* p, integral-type i) noexcept; 


效果 


return p->fetch_add(i); 


std::atomic_fetch_add_explicit 非 成 员 有 函数 
从 atomic<integral-type> 实例 中 原子 的 读 取 一 个 值 ， 并 且 将 其 与 给 定 j 值 相 加 ， 和 替换 原 值 。 
声明 
integral-type atomic_fetch_add_explicit( 
volatile atomic<integral-type>* p, integral-type i, 
memory _order order) noexcept; 
integral-type atomic_fetch_add_explicit( 
atomic<integral-type>* p, integral-type i, memory_order 


order) 
noexcept; 


效果 
return p->fetch_add(i,order); 
std::atomic<integral-type>::fetch_sub 7% ii % žk 


原子 的 加 载 一 个 值 ， 然 后 使 用 与 提供 ji 相 减 的 结果 ， 替 换 掉 原 值 。 


声明 


integral-type fetch_sub( 
integral-type i,memory_order order = memory_order_seq_cst) 
volatile noexcept; 
integral-type fetch_sub( 
integral-type i,memory_order order = memory_order_seq_cst) 
noexcept,; 


效果 
原子 的 查询 this 中 的 值 ， 将 old-value-i 的 和 存 回 this。 


回 


*this 之 前 存储 的 值 。 


回 
出 


ae A 


NOTE: 对 于 *this 的 内 存 地 址 来 说 ， 这 是 一 个 “ 读 - 改 - 写 " 操 作 。 


std::atomic_fetch_sub JF A hi HA 
从 atomic<integral-type> 实例 中 原子 的 读 取 一 个 值 ， 并 且 将 其 与 给 定 ij 值 相 减 ， 替 换 原 值 。 


声明 


integral-type atomic_fetch_sub( 

volatile atomic<integral-type>* p, integral-type i) 
noexcept; 
integral-type atomic_fetch_sub( 

atomic<integral-type>* p, integral-type i) noexcept; 


效果 
return p->fetch_sub(i); 
std::atomic_fetch_sub_ explicit 非 成 员 有 函数 


从 atomic<integral-type> 实例 中 原子 的 读 取 一 个 值 ， 并 且 将 其 与 给 定 ij 值 相 减 ， 替 换 原 值 。 


声明 


integral-type atomic_fetch_sub_explicit( 
volatile atomic<integral-type>* p, integral-type i, 
memory _order order) noexcept; 
integral-type atomic_fetch_sub_explicit( 
atomic<integral-type>* p, integral-type i, memory_order 
order ) 
noexcept; 


效果 


return p->fetch_sub(i, order); 


std::atomic<integral-type>::fetch_and 7% ii % žk 


从 atomic<integral-type> 实例 中 原子 的 读 取 一 个 值 ， 并且 将 其 与 给 定 i 值 进 ARE > A 
换 原 值 。 


声明 


integral-type fetch_and( 
integral-type i,memory_order order = memory_order_seq_cst) 
volatile noexcept; 
integral-type fetch_and( 
integral-type i,memory_order order = memory_order_seq_cst) 
noexcept; 


原子 的 查询 this 中 的 值 ， 将 old-value&i 的 和 存 回 this。 


可 
*this 之 前 存储 的 值 。 


回 
出 


ae A 


NOTE: 对 于 *this 的 内 存 地 址 来 说 ， 这 是 一 个 " 读 - 改 - 写 ?操作 。 


std::atomic_fetch_and } R i Hak 


从 atomic<integral-type> 实例 中 原子 的 读 取 一 个 值 ， 并且 将 其 与 给 定 i 值 进 与 操作 后 ， 替 
换 原 值 。 


声明 
integral-type atomic_fetch_and( 
volatile atomic<integral-type>* p, integral-type i) 
noexcept; 


integral-type atomic_fetch_and( 
atomic<integral-type>* p, integral-type i) noexcept; 


效果 


return p->fetch_and(i); 


std::atomic_fetch_and_explicit 非 成 员 有 函数 


从 atomic<integral-type> 实例 中 原子 的 读 取 一 个 值 ， 并且 将 其 与 给 定 i 值 进 ARE > A 
换 原 值 。 


声明 
integral-type atomic_fetch_and_explicit( 
volatile atomic<integral-type>* p, integral-type i, 
memory_order order) noexcept; 
integral-type atomic_fetch_and_explicit( 
atomic<integral-type>* p, integral-type i, memory_order 


order) 
noexcept; 


效果 


return p->fetch_and(i, order); 


std::atomic<integral-type>::fetch_or A i % žr 


从 atomic<integral-type> 实例 中 原子 的 读 取 一 个 值 ， 并 且 将 其 与 给 定 i 值 进行 位 或 操作 后 ， 替 
换 原 值 。 


声明 


integral-type fetch_or( 
integral-type i,memory_order order = memory_order_seq_cst) 
volatile noexcept; 
integral-type fetch_or( 
integral-type i,memory_order order = memory_order_seq_cst) 
noexcept,; 


效果 
原子 的 查询 this 中 的 值 ， 将 olq-valueli 的 和 存 回 this 。 


aj 
*this 之 前 存储 的 值 。 


回 
出 


ae A 


NOTE: 对 于 *this 的 内 存 地 址 来 说 ， 这 是 一 个 “ 读 - 改 - 写 " 操 作 。 


std::atomic_fetch_or F} A i BA 


从 atomic<integral-type> 实例 中 原子 的 读 取 一 个 值 ， 并且 将 其 与 给 定 i 值 进行 位 或 操作 后 ， 替 
换 原 值 。 


声明 
integral-type atomic_fetch_or( 
volatile atomic<integral-type>* p, integral-type i) 
noexcept; 


integral-type atomic_fetch_or( 
atomic<integral-type>* p, integral-type i) noexcept; 


效果 


return p->fetch_or(i); 


std::atomic_fetch_or_explicit #2 i 42 


从 atomic<integral-type> 实例 中 原子 的 读 取 一 个 值 ， 并 且 将 其 与 给 定 ij 值 进 行 位 或 操作 后 ， 替 
换 原 值 。 


声明 


integral-type atomic_fetch_or_explicit( 
volatile atomic<integral-type>* p, integral-type i, 
memory _order order) noexcept; 
integral-type atomic_fetch_or_explicit( 
atomic<integral-type>* p, integral-type i, memory_order 
order ) 
noexcept; 


效果 


return p->fetch_or(i, order); 


std::atomic<integral-type>::fetch_xor 成 员 有 函数 


从 atomic<integral-type> 实例 中 原子 的 读 取 一 个 值 ， 并且 将 其 与 给 定 i 值 进行 位 亦 或 操作 后 ， 
替换 原 值 。 


声明 


integral-type fetch_xor( 
integral-type i,memory_order order = memory_order_seq_cst) 
volatile noexcept; 
integral-type fetch_xor( 
integral-type i,memory_order order = memory_order_seq_cst) 
noexcept; 


效果 
原子 的 查询 this 中 的 值 ， 将 old-value^j 的 和 存 回 this。 


回 


*this 之 前 存储 的 值 。 


回 
出 


ae A 


NOTE: 对 于 *this 的 内 存 地 址 来 说 ， 这 是 一 个 “ 读 - 改 - 写 "操作 。 


std::atomic_fetch_xor 非 成 员 有 函数 


从 atomic<integral-type> 实例 中 原子 的 读 取 一 个 值 并 且 将 其 与 给 定 j 值 进行 位 异 或 操作 后 % 
替换 原 值 。 


声明 


integral-type atomic_fetch_xor_explicit( 
volatile atomic<integral-type>* p, integral-type i, 
memory _order order) noexcept; 
integral-type atomic_fetch_xor_explicit( 
atomic<integral-type>* p, integral-type i, memory_order 
order) 
noexcept; 


效果 


return p->fetch_xor(i, order); 


std::atomic_fetch_xor_explicit 非 成 员 有 函数 


从 atomic<integral-type> 实例 中 原子 的 读 取 一 个 值 2 并 且 将 其 与 给 定 j 值 进行 位 异 或 操作 后 2 
替换 原 值 。 


声明 
integral-type atomic_fetch_xor_explicit( 
volatile atomic<integral-type>* p, integral-type i, 
memory _order order) noexcept; 
integral-type atomic_fetch_xor_explicit( 
atomic<integral-type>* p, integral-type i, memory_order 


order) 
noexcept; 


效果 


return p->fetch_xor(i, order); 


std::atomic<integral-type>::operatort++ 前 置 递增 操作 


原子 的 将 *this 中 存储 的 值 加 1， 并 返回 新 值 。 


声明 


integral-type operator++() volatile noexcept; 
integral-type operator++() noexcept; 


效果 


return this->fetch_add(1) + 1; 


std::atomic<integral-type>::operator++ 后 置 递增 操作 
原子 的 将 *this 中 存储 的 值 加 1， 并 返回 昌 值 。 


声明 


integral-type operator++() volatile noexcept; 
integral-type operator++() noexcept; 


效果 


return this->fetch_add(1); 


std::atomic<integral-type>::operator-- 前 置 递减 操作 
原子 的 将 *this 中 存储 的 值 减 1， 并 返回 新 值 。 


声明 


integral-type operator--() volatile noexcept; 
integral-type operator--() noexcept; 


BR 


return this->fetch_add(1) - 1; 


std::atomic<integral-type>::operator-- 后 置 递减 操作 


原子 的 将 *this 中 存储 的 值 减 1， 并 返回 昌 值 。 


声明 


integral-type operator--() volatile noexcept; 
integral-type operator--() noexcept; 


效果 


return this->fetch_add(1); 


std::atomic<integral-type>::operatort= 复合 赋值 操作 
原子 的 将 给 定 值 与 Mhis 中 的 值 相 加 ， 并 返回 新 值 。 


声明 


integral-type operator+=(integral-type i) volatile noexcept; 
integral-type operator+=(integral-type i) noexcept; 


效果 


return this->fetch_add(i) + i; 


std::atomic<integral-type>::operator-= 复合 赋值 操作 
原子 的 将 给 定 值 与 *this 中 的 值 相 减 ， 并 返回 新 值 。 


声明 


integral-type operator-=(integral-type i) volatile noexcept; 
integral-type operator-=(integral-type i) noexcept; 


BR 


return this->fetch_sub(i,std::memory_order_seq_cst) - i; 


std::atomic<integral-type>::operator&= 复合 赋值 操作 


原子 的 将 给 定 值 与 *this 中 的 值 相 与 ， 并 返回 新 值 。 


声明 


integral-type operator&=(integral-type i) volatile noexcept; 
integral-type operator&=(integral-type i) noexcept; 


return this->fetch_and(i) & i; 


std::atomic<integral-type>::operator|= 复合 赋值 操作 
原子 的 将 给 定 值 与 #his 中 的 值 相 或 ， 并 返回 新 值 。 


声明 


integral-type operator |=(integral-type i) volatile noexcept; 
integral-type operator |=(integral-type i) noexcept; 


return this->fetch_or(i,std::memory_order_seq_cst) | i; 


std::atomic<integral-type>::operator4= 复合 赋值 操作 
原子 的 将 给 定 值 与 *this 中 的 值 相 亦 或 ， 并 返回 新 值 。 


声明 


integral-type operator^=(integral-type i) volatile noexcept; 
integral-type operator4=(integral-type i) noexcept; 


BR 


return this->fetch_xor(i,std::memory_order_seq_cst) ^ i; 


std::atomic<T*> 局 部 特 化 


std: :atomic<T*> A std: :atomic 特 化 了 指针 类 型 原子 变量 ? 并 提供 可 二 系 列 相 关 操 作 了? 


std: :atomic<T*> 是 CopyConstructible( 找 贝 构造 ) 和 CopyAssignable( 找 贝 赋值 ) 的 ， 因 为 操作 
是 原子 的 ， 在 同一 时 间 只 能 执行 一 个 操作 。 


型 定义 


$k 


template<typename T> 
struct atomic<T*> 


{ 

atomic() noexcept = default; 

constexpr atomic(T*) noexcept; 

bool operator=(T*) volatile; 

bool operator=(T*); 

atomic(const atomic&) = delete; 

atomic& operator=(const atomic&) = delete; 

atomic& operator=(const atomic&) volatile = delete; 

bool is_lock_free() const volatile noexcept; 

bool is_lock_free() const noexcept; 

void store(T*,memory_order = memory_order_seq_cst) volatile 
noexcept; 

void store(T*,memory_order = memory_order_seq_cst) noexcept; 

T* load(memory_order = memory_order_seq_cst) const volatile 
noexcept; 

T* load(memory_order = memory_order_seq_cst) const noexcept; 

T* exchange(T*,memory_order = memory_order_seq_cst) volatile 
noexcept; 

T* exchange(T*,memory_order = memory_order_seq_cst) noexcept; 

bool compare_exchange_strong( 

T* & old_value, T* new_value, 
memory_order order = memory_order_seq_cst) volatile 

noexcept; 


bool compare_exchange_strong( 
T* & old_value, T* new_value, 
memory_order order = memory_order_seq_cst) noexcept; 
bool compare_exchange_strong( 
T* & old_value, T* new_value, 
memory_order success_order,memory_order failure_order) 
volatile noexcept; 
bool compare_exchange_strong( 


T* & old_value, T* new_value, 


memory_order success_order,memory_order failure_order) 


noexcept; 


bool compare_exchange_weak ( 


T* & old_value, T* new_value, 


memory_order order = memory_order_seq_cst) volatile 


noexcept; 


bool compare_exchange_weak ( 


T* & old_value, T* new_value, 


memory_order order = memory_order_seq_cst) noexcept; 


bool compare_exchange_weak ( 


T* & old_value, T* new_value, 


memory_order success_order,memory_order failure_order) 


volatile noexcept; 


bool compare_exchange_weak ( 


T* & old_value, T* new_value, 


memory_order success_order,memory_order failure_order) 


noexcept; 


operator T*() const volatile noexcept; 


operator T*() const noexcept; 


T* fetch_add( 
ptrdiff_t,memory_order = memory_order_seq_cst) 
noexcept; 
T* fetch_add( 
ptrdiff_t,memory_order = memory_order_seq_cst) 
T* fetch_sub( 
ptrdiff_t,memory_order = memory_order_seq_cst) 
noexcept; 
T* fetch_sub( 
ptrdiff_t,memory_order = memory_order_seq_cst) 
T* operator++() volatile noexcept; 


= 
z 
= 
E 
a 
Be 


operator++() noexcept; 
operator++(int) volatile noexcept; 
operator++(int) noexcept; 
operator--() volatile noexcept; 
operator--() noexcept; 
operator--(int) volatile noexcept; 


volatile 


noexcept; 


volatile 


noexcept; 


T* operator--(int) noexcept 


T* operator+=(ptrdiff_t) volatile noexcept; 
T* operator+=(ptrdiff_t) noexcept; 
T* operator-=(ptrdiff_t) volatile noexcept; 
T* operator-=(ptrdiff_t) noexcept; 

}; 


bool atomic_is_lock_free(volatile const atomic<T*>*) noexcept; 
bool atomic_is_lock_free(const atomic<T*>*) noexcept; 
void atomic_init(volatile atomic<T*>*, T*) noexcept; 
void atomic_init(atomic<T*>*, T*) noexcept; 
T* atomic_exchange(volatile atomic<T*>*, T*) noexcept; 
T* atomic_exchange(atomic<T*>*, T*) noexcept; 
T* atomic_exchange_explicit(volatile atomic<T*>*, T*, 
memory_order ) 
noexcept; 
T* atomic_exchange_explicit(atomic<T*>*, T*, memory_order) 
noexcept; 
void atomic_store(volatile atomic<T*>*, T*) noexcept; 
void atomic_store(atomic<T*>*, T*) noexcept; 
void atomic_store_explicit(volatile atomic<T*>*, T*, 
memory_order ) 
noexcept; 
void atomic_store_explicit(atomic<T*>*, T*, memory_order) 
noexcept; 
T* atomic_load(volatile const atomic<T*>*) noexcept; 
T* atomic_load(const atomic<T*>*) noexcept; 
T* atomic_load_explicit(volatile const atomic<T*>*, 
memory_order) noexcept; 
T* atomic_load_explicit(const atomic<T*>*, memory_order ) 
noexcept; 
bool atomic_compare_exchange_strong( 
volatile atomic<T*>*,T* * old_value,T* new_value) noexcept; 
bool atomic_compare_exchange_strong( 
volatile atomic<T*>*,T* * old_value,T* new_value) noexcept; 
bool atomic_compare_exchange_strong_explicit( 
atomic<T*>*,T* * old_value,T* new_value, 
memory_order success_order,memory_order failure_order) 
noexcept; 


bool atomic_compare_exchange_strong_explicit( 
atomic<T*>*,T* * old_value,T* new_value, 
memory_order success_order,memory_order failure_order) 
noexcept; 
bool atomic_compare_exchange_weak ( 
volatile atomic<T*>*,T* * old_value,T* new_value) noexcept; 
bool atomic_compare_exchange_weak( 
atomic<T*>*,T* * old_value,T* new_value) noexcept; 
bool atomic_compare_exchange_weak_explicit( 
volatile atomic<T*>*,T* * old_value, T* new_value, 
memory_order success_order,memory_order failure_order) 
noexcept; 
bool atomic_compare_exchange_weak_explicit( 
atomic<T*>*,T* * old_value, T* new_value, 
memory_order success_order,memory_order failure_order) 
noexcept; 


T* atomic_fetch_add(volatile atomic<T*>*, ptrdiff_t) noexcept; 
T* atomic_fetch_add(atomic<T*>*, ptrdiff_t) noexcept; 
T* atomic_fetch_add_explicit( 
volatile atomic<T*>*, ptrdiff_t, memory_order) noexcept; 
T* atomic_fetch_add_explicit( 
atomic<T*>*, ptrdiff_t, memory_order) noexcept; 
T* atomic_fetch_sub(volatile atomic<T*>*, ptrdiff_t) noexcept; 
T* atomic_fetch_sub(atomic<T*>*, ptrdiff_t) noexcept; 
T* atomic_fetch_sub_explicit( 
volatile atomic<T*>*, ptrdiff_t, memory_order) noexcept; 
T* atomic_fetch_sub_explicit( 
atomic<T*>*, ptrdiff_t, memory_order) noexcept; 


在 主 模板 中 也 提供 了 一 些 相同 的 操作 (可 见 11.3.8 节 ) 。 


std::atomic<T*>::fetch_add 7% ii % žr 
原子 的 加 载 一 个 值 ， 然 后 使 用 与 提供 j 相 加 (使 用 标准 指针 运算 规则 ) 的 结果 ， 替 换 掉 原 值 。 


声明 


T* fetch_add( 
ptrdiff_t i,memory_order order = memory_order_seq_cst) 
volatile noexcept; 
T* fetch_add( 
ptrdiff_t i,memory_order order = memory_order_seq_cst) 
noexcept; 


原子 的 查询 this 中 的 值 ， 将 old-valuet+ti 的 和 存 回 this。 


*this 之 前 存储 的 值 。 


NOTE: 对 于 *this 的 内 存 地 址 来 说 ， 这 是 一 个 “ 读 - 改 - 写 " 操 作 。 


std::atomic_fetch_add JF i HA 


从 atomic<T*> 实例 中 原子 的 读 取 一 个 值 ， 并且 将 其 与 给 定 i 值 进行 位 相 加 操作 (使 用 标准 指针 
运算 规则 ) 后 ， 替 换 原 值 。 


声明 
T* atomic_fetch_add(volatile atomic<T*>* p, ptrdiff_t i) 


noexcept; 
T* atomic_fetch_add(atomic<T*>* p, ptrdiff_t i) noexcept; 


效果 


return p->fetch_add(i); 


std::atomic_fetch_add_explicit 非 成 员 有 函数 


从 atomicet*> 实例 中 原子 的 读 取 一 个 值 ， 并且 将 其 与 给 定 i 值 进行 位 相 加 操作 (使 用 标准 指针 
运算 规则 ) 后 ， 替 换 原 值 。 


声明 


T* atomic_fetch_add_explicit( 

volatile atomic<T*>* p, ptrdiff_t i1,memory_order order) 
noexcept; 
T* atomic_fetch_add_explicit( 

atomic<T*>* p, ptrdiff_t i, memory_order order) noexcept; 


效果 


return p->fetch_add(i, order); 


std::atomic<T*>::fetch_sub 7% ii % žk 
原子 的 加 载 一 个 值 ， 然 后 使 用 与 提供 i 相 减 (使 用 标准 指针 运算 规则 ) 的 结果 ， 和 替换 掉 原 值 。 


声明 


T* fetch_sub( 
ptrdiff_t i,memory_order order = memory_order_seq_cst) 
volatile noexcept; 
T* fetch_sub( 
ptrdiff_t i,memory_order order = memory_order_seq_cst) 
noexcept; 


效果 
原子 的 查询 this 中 的 值 ， 将 old-value-i 的 和 存 回 this。 


加 
*this 之 前 存储 的 值 。 


站 入 贷 贷 
tr g 


NOTE: 对 于 *this 的 内 存 地 址 来 说 ， 这 是 一 个 “ 读 - 改 - 写 " 操 作 。 


std::atomic_fetch_sub # R i 43 


从 atomic<T*> 实例 中 原子 的 读 取 一 个 值 ， 并 且 将 其 与 给 定 i 值 进行 位 相 减 操作 (使 用 标准 指针 


运算 规则 ) 后 ， 替 换 原 值 。 


声明 


T* atomic_fetch_sub(volatile atomic<T*>* p, ptrdiff_t i) 
noexcept; 
T* atomic_fetch_sub(atomic<T*>* p, ptrdiff_t i) noexcept; 


效果 


return p->fetch_sub(i); 


K 


函数 


从 atomicet*> 实例 中 原子 的 读 取 一 个 值 ， 并 且 将 其 与 给 定 i 值 进行 位 相 减 操作 (使 用 标准 指针 
运算 规则 ) 后 ， 和 替换 原 值 。 


std::atomic _fetch_sub explicit 非 成 员 


声明 
T* atomic_fetch_sub_explicit( 
volatile atomic<T*>* p, ptrdiff_t i1,memory_order order) 
noexcept; 


T* atomic_fetch_sub_explicit( 
atomic<T*>* p, ptrdiff_t i, memory_order order) noexcept; 


效果 


return p->fetch_sub(i, order); 


std::atomic<T*>::operatort++ 前 置 递增 操作 
原子 的 将 sthis 中 存储 的 值 加 1( 使 用 标准 指针 运算 规则 )， 并 返回 新 值 。 


声明 


T* operator++() volatile noexcept 
T* operator++() noexcept; 


效果 


return this->fetch_add(1) + 1; 


std::atomic<T*>::operator++ 后 置 递增 操作 
原子 的 将 *this 中 存储 的 值 加 1( 使 用 标准 指针 运算 规则 )， 并 返回 旧 值 。 


声明 


T* operator++() volatile noexcept 
T* operator++() noexcept; 


效果 


return this->fetch_add(1); 


std::atomic<T*>::operator-- 前 置 递减 操作 
原子 的 将 sthis 中 存储 的 值 减 1( 使 用 标准 指针 运算 规则 )， 并 返回 新 值 。 


声明 


T* operator--() volatile noexcept 
T* operator--() noexcept; 


效果 


return this->fetch_sub(1) - 1; 


std::atomic<T*>::operator-- 后 置 递减 操作 
原子 的 将 *this 中 存储 的 值 减 1( 使 用 标准 指针 运算 规则 )， 并 返回 旧 值 。 


声明 


T* operator--() volatile noexcept 
T* operator--() noexcept; 


效果 


return this->fetch_sub(1); 


std::atomic<T*>::operatort= 复合 赋值 操作 
原子 的 将 *this 中 存储 的 值 与 给 定 值 相 加 (使 用 标准 指针 运算 规则 )， 并 返回 新 值 。 


声明 


T* operator+=(ptrdiff_t i) volatile noexcept; 
T* operator+=(ptrdiff_t i) noexcept; 


效果 
return this->fetch_add(i) + i; 
std::atomic<T*>::operator-= 复合 赋值 操作 


原子 的 将 *this 中 存储 的 值 与 给 定 值 相 减 (使 用 标准 指针 运算 规则 )， 并 返回 新 值 。 


声明 


T* operator+=(ptrdiff t i) volatile noexcept; 
T* operator+=(ptrdiff_t i) noexcept; 


return this->fetch_add(i) - i; 


D.4 <future> 头 文件 


<future> 头 文件 提供 处 理 异 步 结 果 ( 在 其 他 线程 上 执行 额 结果 ) 的 工具 。 


头 文件 内 容 


namespace std 


{ 


enum class future_status { 
ready, timeout, deferred }; 


enum class future_errc 


{ 


broken_promise, 
future_already_retrieved, 
promise_already satisfied, 
no_state 


}; 
class future_error; 
const error_category& future_category()j; 


error_code make_error_code(future_errc e); 
error_condition make_error_condition(future_errc e); 


template<typename ResultType> 
class future; 


template<typename ResultType> 
class shared_future; 


template<typename ResultType> 
class promise; 


template<typename FunctionSignature> 
class packaged_task; // no definition provided 


template<typename ResultType, typename ... Args> 
class packaged_task<ResultType (Args...)>; 


enum class launch { 
async, deferred 


}; 

template<typename FunctionType, typename ... Args> 
future<result_of<FunctionType(Args...)>::type> 
async(FunctionType&& func, Args&& ... args); 

template<typename FunctionType, typename ... Args> 
future<result_of<FunctionType(Args...)>::type> 
async(std::launch policy, FunctionType&& func,Args&& ... args); 


D.4.1 std::future 类 型 模板 


std: :future 类 型 模板 是 为 了 等 待 其 他 线程 上 的 异步 结果 。 其 
和 std: :promise ’° std::packaged_task 类 型 模板 ， 还 有 std: :async hy FAR HR > 都 是 为 HU t 
RES HLH o RA std::future 实例 可 以 在 任意 时 间 引 用 异步 结果 。 


std::future 实例 是 MoveConstructible( 移 动 构造 ) 和 MoveAssignable( 移 动 赋值 )， 不 过 不 能 
CopyConstructible(74 Jl 74 3% )4e CopyAssignable(# Jl mA 42) ° 


Hs 


类 型 声明 


template<typename ResultType> 
class future 


{ 
public: 
future() noexcept; 
future(future&&) noexcept; 
future& operator=(future&&) noexcept; 
~future(); 


future(future const&) = delete; 
future& operator=(future const&) = delete; 


shared_future<ResultType> share(); 
bool valid() const noexcept; 
see description get(); 
void wait(); 
template<typename Rep, typename Period> 
future_status wait_for( 
std::chrono: :duration<Rep, Period> const& relative_time); 
template<typename Clock, typename Duration> 
future_status wait_until( 


std::chrono::time_point<Clock,Duration> const& 
absolute _time); 


}; 


std::future 默认 构造 函数 
不 使 用 异步 结果 构造 一 个 std::future 对 象 。 


声明 


future() noexcept; 


构造 一 个 新 的 std::future 实例 。 


后 置 条 件 
valid() 返 回 false。 


抛 出 
z 
std::future 移动 构造 函数 


使 用 另外 一 个 对 象 ， 构 造 一 个 std::future 对 象 ， 将 相关 异步 结果 的 所 有 权 转 移 给 
新 std::future 对 象 。 


声明 


future(future&& other) noexcept; 


使 用 已 有 对 象 构造 一 个 新 的 std:: future tH ° 


后 置 条 件 

已 有 对 得 中 的 异步 结果 ， 将 于 新 的 对 象 相关 联 。 然 后 ， 解 除 已 有 对 人 象 和 蜡 步 之 间 的 关 

系 。 this->valid() 返回 的 结果 与 之 前 已 有 对 象 other.valid() 返回 的 结果 相同 。 在 调用 该 构 
1% BBG > other.valid() 将 返回 false。 


抛 出 

无 

std::future 移动 赋值 操作 

将 已 有 std::future 对 象 中 异步 结果 的 所 有 权 ， 转 移 到 另 一 对 象 当 中 。 


声明 


future(future&& other) noexcept; 


在 两 个 std::future 实例 中 转移 异步 结果 的 状态 。 


后 置 条 件 
当 执 行 完 赋值 操作 后 ， *this.other 就 与 异步 结果 没有 关系 了 。 异 步 状态 (如 果 有 的 话 ) 在 释放 
后 与 *this 相关 ， 并 且 在 最 后 一 次 引用 后 ， 销 毁 该 状态 。 this->valid() 返回 的 结果 与 之 前 已 


有 对 象 other,valid() 返回 的 结果 相同 。 在 调用 该 构造 函数 后 ， other.valid() 将 返回 false。 
He B 

无 

std::future 析 构 有 函数 

销毁 一 个 std: :future Ho 


声明 


~future(); 


销毁 «this 。 如 果 这 是 最 后 一 次 引用 与 *this 相关 的 异步 结果 ， 之 后 就 会 将 该 异步 结果 销 


BE o 


抛 出 
无 
std::future::share 成 员 有 函数 


构造 一 个 新 std: :shared_future 实例 ， 并 且 将 *this 异步 结果 的 所 有 权 转 移 到 新 
的 std::shared future 实例 中 。 


声明 


shared_future<ResultType> share(); 


效果 
如 同 shared future(std::move(*this)) ° 


后 置 条 件 
当 调 用 share() 成 员 BAX > 与 *this 相 关 的 异步 结果 将 与 新 构造 的 std::shared_future 实例 相 
关 。 this->valid() 将 返回 false。 


抛 出 
无 


std::future::valid 7 i 42% 


检查 std::future 实例 是 否 与 一 个 异步 结果 相关 联 。 


声明 
bool valid() const noexcept; 
返回 
当 与 异步 结果 相关 时 ， 返 回 true， 否 则 返回 false。 
抛 出 
无 
std::future::wait 成 员 有 函数 


如 果 与 *this 相关 的 状态 包含 延迟 函数 ， 将 调用 该 函数 。 否 则 ， 会 等 待 std::future 实例 中 
的 异步 结果 准备 就 绪 。 


声明 


void wait(); 


先决 条 件 
this->valid() 将 会 返回 true。 


效果 
当 相 关 状态 包含 延迟 函数 ， 调 用 延迟 函数 ， 并 保存 返回 的 结果 ， 或 将 抛 出 的 异常 保存 成 为 异 
步 结果 。 和 否则 ， 会 阻塞 到 *this 准备 就 绪 。 


Pa h 
无 
std::future::wait_for 7% it 4 
等 待 std::future 实例 上 相关 异步 结果 准备 就 绪 ， 或 超过 某 个 给 定 的 时 间 。 
声明 
template<typename Rep, typename Period> 


future_status wait_for( 
std::chrono: :duration<Rep, Period> const& relative_time); 


先决 条 件 
this->valid() 将 会 返回 true。 


如 果 与 *this 相关 的 异步 结果 包含 一 个 std::async VA AER BR (RINT)? PARAL 
塞 立即 返回 。 否 则 将 阻塞 实例 ， 直 到 与 *this 相关 蜡 步 结 果 准 备 就 绪 ， 或 超过 给 定 的 
relative_time 时 长 。 

返回 

当 与 *this 相关 的 异步 结果 包含 一 个 std: :async 调用 的 延迟 函数 (还 未 执行 ) > 

回 std::future_status::deferred ; 44 *this 相关 的 异步 结果 准备 就 绪 ， 返 

回 std::future_status::ready ; 当 给 定时 间 超 过 relative _ time 时 ， 返 


回 std::future_status::timeout ° 
NOTE: 线 程 阻 塞 的 时 间 可 能 超 多 给 定 的 时 长 。 时 长 尽 可 能 由 一 个 稳定 的 时 钟 决 定 。 


抛 出 
无 


std::future::wait_until 7% ii $% žr 
等 待 std::future 实例 上 相关 异步 结果 准备 就 绪 ， 或 超过 某 个 给 定 的 时 间 。 


声明 


template<typename Clock, typename Duration> 
future_status wait_until( 
std::chrono::time_point<Clock, Duration> const& absolute_time); 


先决 条 件 
this->valid() 将 返回 true。 


如 果 与 *this 相关 的 异步 结果 包含 一 个 std: :async 调用 的 延迟 函数 (还 未 执行 T)? 那么 就 不 阻 
塞 立即 返回 。 否 则 将 阻塞 实例 ， 直 到 与 *this 相关 异步 结果 准备 就 绪 ， 或 clock::now() 返回 
的 时 间 大 于 等 于 absolute_ time。 

返回 

当 与 *this 相关 的 异步 结果 包含 一 个 std: :async 调用 的 延迟 函数 (还 未 执行 ) ， 返 

回 std::future_status::deferred ; 44 *this 相关 的 异步 结果 准备 就 绪 > 

回 std::future_status::ready ; Clock::now() 返回 的 时 间 大 于 等 于 absolute time， 返 


回 std::future_status::timeout ° 


NOTE: 这 里 不 保证 调用 线程 会 被 阻塞 多 久 ， 只 有 函数 返回 std::future_status::timeout °’ A 
后 Clock::now() 返回 的 时 间 大 于 等 于 absolute time 的 时 候 ， 线 程 才 会 解除 阻塞 。 


抛 出 
无 


std::future::get % i 8% 


Je 


当 相 关 状 态 包 含 一 个 std::async 调用 的 延迟 函数 ， 调 用 该 延迟 函数 ， 并 返回 结果 ; 否则 ， 等 
待 与 std: :future 实例 相关 的 异步 结果 准备 就 绪 ， 之 后 返回 存储 的 值 或 异常 。 


声明 


void future<void>: :get(); 
R& future<R&>::get(); 
R future<R>::get(); 


先决 条 件 

this->valid() 将 返回 true。 

效果 

如 果 *this 相 关 状 态 包含 一 个 延期 函数 ， 那 么 调用 这 个 函数 并 返回 结果 ， 或 将 抛 出 的 异常 进行 
传播 。 

和 否则， 线程 就 要 被 阻塞 ， 直 到 与 *this 相 关 的 异步 结果 就 绪 。 当 结果 存储 了 一 个 异常 ， 那 么 就 
就 会 将 存储 异常 抛 出 。 和 否则， 将 会 返回 存储 值 。 

返回 

当 相关 状态 包含 一 个 延期 函数 ， 那 么 这 个 延期 函数 的 结果 将 被 返回 。 否 则 ， 当 ResultType 为 
void 时 ， 就 会 按照 常规 调用 返回 。 如 果 ResultType 是 R&(R 类 型 的 引用 )， 存 储 的 引用 值 将 会 被 
Eo SM > ARAYA SRA o 


抛 出 
异常 由 延期 函数 ， 或 存储 在 异步 结果 中 的 异常 (如 果 有 的 话 ) 抛 出 。 


后 置 条 件 


this ->valid()==false 


D.4.2 std::shared future 类 型 模板 


std::shared future 类 型 模板 是 为 了 等 待 其 他 线程 上 的 异步 结果 2 其 
和 std: :promise ° std::packaged_task 类 型 模板 ， 还 有 std::async hy FAR HR? 都 是 为 异步 结 
果 准 备 的 工具 。 多 个 std::shared_future 实例 可 以 引用 同一 个 异步 结果 。 


std::shared_future 实例 是 CopyConstructible( 找 贝 构造 ) 和 CopyAssignable( 拷 贝 赋值 )。 你 也 
可 以 同 ResultType 的 std::future 类 型 对 象 ， 移 动 构造 一 个 std::shared future 类 型 对 象 。 


访问 给 定 std::shared_future 实例 是 非 同步 的 。 因 此 ， 当 有 多 个 线程 访问 同一 

个 std::shared_future 实例 ， 且 无 任何 外 围 同 步 操作 时 ， 这 样 的 访问 是 不 安全 的 。 不 过 访问 
关联 状态 时 是 同步 的 ， 所 以 多 个 线程 访问 多 个 独立 的 std::shared_future 实例 ， 且 没有 外 围 
同步 操作 的 时 候 ， 是 安全 的 。 


Hs 


定义 


template<typename ResultType> 

class shared_future 

{ 

public: 
shared_future() noexcept; 
shared_future(future<ResultType>&&) noexcept; 


shared_future(shared_future&&) noexcept; 
shared_future(shared_future const&); 

shared_future& operator=(shared_future const&); 
shared_future& operator=(shared_future&&) noexcept; 
~shared_future(); 


bool valid() const noexcept; 


see description get() const; 


void wait() const; 


template<typename Rep, typename Period> 
future_status wait_for( 
std: :chrono: :duration<Rep, Period> const& relative_time) 
const; 


template<typename Clock, typename Duration> 
future_status wait_until( 
std::chrono::time_point<Clock,Duration> const& 
absolute_time) 
const; 


ti 


std::shared future 默认 构造 函数 
不 使 用 关联 异步 结果 ， 构 造 一 个 std::shared future 对 象 。 


声明 
shared_future() noexcept; 


效果 


构造 一 个 新 的 std::shared_ future 实例 。 


后 置 条 件 
当 新 实例 构建 完成 后 ， 调 用 valid() 将 返回 false 。 


抛 出 
无 


std::shared_future 移动 构造 函数 


以 一 个 已 创建 std::shared_future 对 象 为 准 ， 构 造 std::shared future 实例 ， 并 将 使 
用 std::shared_future 对 象 关联 的 异步 结果 的 所 有 权 转 移 到 新 的 实例 中 。 


声明 
shared_future(shared_future&& other) noexcept; 


效果 


构造 一 个 新 std::shared_future 实例 。 


后 置 条 件 
将 other 对 象 中 关联 异步 结果 的 所 有 权 转 移 到 新 对 象 中 ， 这 样 other 对 象 就 没有 与 之 相关 联 的 异 
步 结果 了 。 


抛 出 
无 
std::shared_future 移动 对 应 std::future 对 象 的 构造 函数 


以 一 个 已 创建 std::future 对 象 为 准 ， 构 造 std::shared_future 实例 ， 并 将 使 
用 std::shared_future 对 象 关联 的 异步 结果 的 所 有 权 转 移 到 新 的 实例 中 。 


声明 


shared_future(std: :future<ResultType>&& other) noexcept; 


效果 


构造 一 个 std::shared future 对 象 。 


后 置 条 件 
将 other 对 象 中 关联 异步 结果 的 所 有 权 转 移 到 新 对 象 中 ， 这 样 other 对 象 就 没有 与 之 相关 联 的 异 
步 结果 了 。 


抛 出 
无 
std::shared_future 拷贝 构造 函数 


以 一 个 已 创建 std::future 对 象 为 准 ， 构 造 std: :shared_future 实例 > 并 将 使 
用 std::shared_future 对 象 关 联 的 异步 结果 (如 果 有 的 话 ) 拷 贝 到 新 创建 对 象 当 中 ， 两 个 对 象 共 
享 该 异步 结果 。 


声明 


shared_future(shared_future const& other); 
效果 
构造 一 个 std::shared_future 对 象 。 


后 置 条 件 
将 other 对 象 中 关联 异步 结果 拷贝 到 新 对 象 中 ， 与 other 共享 关联 的 异步 结果 。 


抛 出 

Je 

std::shared_future 析 构 函数 
销毁 一 个 std::shared_future 对 象 。 


声明 


~shared_future(); 


效果 
将 *this 销毁 。 如 果 *this 关联 的 异步 结果 与 std: :promise 或 std::packaged task 不 再 有 关 
联 ， 那 么 该 函数 将 会 切断 std::shared future 实例 与 异步 结果 的 联系 ， 并 销毁 异步 结果 。 


抛 出 
无 
std::shared_future::valid 7% i $% žr 
检查 std::shared_future 实例 是 否 与 一 个 异步 结果 相关 联 。 
声明 
bool valid() const noexcept; 
返回 
当 与 异步 结果 相关 时 ， 返 回 true， 否 则 返回 false 。 
抛 出 
无 
std::shared_future::wait 成 员 有 函数 


当 *this 关 联 状 态 包 含 一 个 延期 函数 ， 那 么 调用 这 个 函数 。 否 则 ， 等 待 直到 
与 std::shared_future 实例 相关 的 异步 结果 就 绪 为 止 。 


声明 


void wait() const; 


先决 条 件 this->valid() 将 返回 true ° 


效果 

当 有 多 个 线程 调用 std::shared_future 实例 上 的 get() 和 wait() 时 ， 实 例会 序列 化 的 共享 同一 关 
联 状态 。 如 果 关 联 状 态 包 括 一 个 延期 函数 ， 那 么 第 一 个 调用 get() 或 wait() 时 就 会 调用 延期 函 
数 ， 并 且 存 储 返 回 值 ， 或 将 抛 出 异常 以 异步 结果 的 方式 保存 下 来 。 


抛 出 

无 

std::shared_future::wait_for 成 员 有 函数 

等 待 std::shared future 实例 上 相关 异步 结果 准备 就 绪 ， 或 超过 某 个 给 定 的 时 间 。 


声明 


template<typename Rep, typename Period> 
future_status wait_for( 

std::chrono: :duration<Rep, Period> const& relative_time) 
const; 


先决 条 件 


this->valid() 将 会 返回 true。 


如 果 与 *this 相关 的 异步 结果 包含 一 个 std::async 调用 的 延期 函数 (还 未 执行 )， 那 
塞 立 即 返回 。 否 则 将 阻塞 实例 ， 直 到 与 *this 相关 蜡 步 结果 准备 就 绪 ， 或 超过 给 定 
relative_time 时 长 。 


BARA EL 
的 


返回 

当 与 *this 相关 的 异步 结果 包含 一 个 std: :async 调用 的 延迟 函数 (还 未 执行 ) ， 返 
回 std::future_status::deferred ; 44 *this 相关 的 异步 结果 准备 就 绪 ， 返 

回 std::future_status::ready ; 当 给 定时 间 超 过 relative _ time 时 ， 返 


回 std::future_status::timeout ° 
NOTE: 线 程 阻 塞 的 时 间 可 能 定 的 时 长 。 时 长 尽 可 能 由 一 个 稳定 的 时 钟 决 定 。 


抛 出 
无 


std::shared_future::wait_until X i % 2 
等 待 std::future 实例 上 相关 异步 结果 准备 就 绪 ， 或 超过 某 个 给 定 的 时 间 。 


声明 


template<typename Clock, typename Duration> 

future_status wait_until( 
std::chrono::time_point<Clock,Duration> const& absolute_time) 

const; 


先决 条 件 
this->valid() 将 返回 true。 


如 果 与 *this 相关 的 异步 结果 包含 一 个 std::async A A ER BR (RANT) >? PARAL 
塞 立即 返回 。 否 则 将 阻塞 实例 ， 直 到 与 *this 相关 异步 结果 准备 就 绪 ， 或 clock::now() 返回 
的 时 间 大 于 等 于 absolute_time。 


返回 

当 与 *this 相关 的 异步 结果 包含 一 个 std::async 调用 Hearse ee > 

回 std::future_status::deferred ; 44 *this n E sie 

回 std::future_status::ready ; Clock::now() 返回 的 时 间 cent time > 34 


回 std::future_status::timeout ° 


NOTE:: Se ee 会 被 阻塞 多 久 ， 只 有 函数 返回 std::future_status::timeout ， 然 
后 Clock::now() 返回 的 时 间 大 于 等 于 absolute time 的 时 候 ， 线 程 才 会 解除 阻塞 。 


抛 出 
无 


std::shared_future::get ™ i 4% 


当 相 关 状 态 包含 一 个 std::async 调用 的 延迟 函数 ， 调 用 该 延迟 函数 ， 并 返回 结果 ; 和 否则， 等 
待 与 std::shared_future 实例 相关 的 异步 结果 准备 就 绪 ， 之 后 返回 存储 的 值 或 异常 。 


声明 


void shared_future<void>::get() const; 
R& shared_future<R&>::get() const; 
R const& shared_future<R>::get() const; 


先决 条 件 
this->valid() 将 返回 true。 


当 有 多 个 线程 调用 std::shared_future 实例 上 的 get() 和 wait() 时 ， 实 例会 序列 化 的 共享 同一 关 
联 状态 。 如 果 关 联 状 态 包 括 一 个 延期 函数 ， 那 么 第 一 个 调用 get() 或 wait() 时 就 会 调用 延期 了 
数 ， 并 且 存 储 返 回 值 ， 或 将 抛 出 异常 以 异步 结果 的 方式 保存 下 来 。 


阻塞 会 知道 *this 关 联 的 异步 结果 就 绪 后 解除 。 当 异步 结果 存储 了 一 个 一 行 ， 那 么 就 会 抛 出 这 
个 异常 。 否 则 ， 返 回 存储 的 值 。 

返回 

当 ResultType 为 void 时 ， 就 会 按照 常规 调用 返回 。 如 果 ResultType 是 R&(R 类 型 的 引用 )， 存 储 
的 引用 值 将 会 被 返回 。 和 否则， 返回 存储 值 的 const 引 用 。 


抛 出 
抛 出 存储 的 异常 (如 果 有 的 话 ) 。 


D.4.3 std::packaged_task& # 7% 7 


std::packaged_task 类 型 模板 可 打包 一 个 函数 或 其 他 可 调用 对 象 ， 所 以 当 函 数 通 
过 std::packaged_task 实例 被 调用 时 ， 结果 将 会 作为 异步 结果 。 这 个 结果 可 以 通过 检 
索 std::future 实例 来 查找 。 


std::packaged_task 实例 是 可 以 MoveConstructible( 移 动 构造 ) 和 MoveAssignable( 移 动 赋值 ) ， 
不 过 不 能 CopyConstructible( 拷 贝 构造 ) 和 CopyAssignable( 描 贝 赋值 ) 。 


template<typename FunctionType> 
class packaged task; // undefined 


template<typename ResultType, typename... ArgTypes> 

class packaged_task<ResultType(ArgTypes...)> 

{ 

public: 
packaged_task() noexcept; 
packaged_task(packaged_task&&) noexcept; 
~packaged_task(); 


packaged_task& operator=(packaged_task&&) noexcept; 


packaged_task(packaged_task const&) = delete; 
packaged_task& operator=(packaged_task const&) = delete; 


void swap(packaged_task&) noexcept; 


template<typename Callable> 
explicit packaged_task(Callable&& func); 


template<typename Callable, typename Allocator> 
packaged_task(std::allocator_arg_t, const 
Allocatoré&, Callable&&) ; 


bool valid() const noexcept; 
std::future<ResultType> get_future(); 

void operator()(ArgTypes...); 

void make_ready_at_thread_exit(ArgTypes...); 
void reset(); 


}; 


std::packaged_task 默认 构造 函数 
构造 一 个 std: :packaged_task xt Ro 


声明 


packaged_task() noexcept; 


效果 
不 使 用 关联 任 务 或 异步 结果 来 构造 一 个 std: :packaged_task 对 象 


抛 出 

Ja 

std::packaged_task 通过 可 调用 对 象 构 造 
使 用 关联 任务 和 异步 结果 ， 构 造 一 个 std: :packaged_task 对 象 。 
声明 


template<typename Callable> 
packaged_task(Callable&& func); 


先决 条 件 
表达 式 func(args...) 必须 是 合法 的 ， 并 且 在 args... 中 的 args-i 参 数 ， 必 须 
是 ArgTypes... 中 ArgTypes-i 类 型 的 一 个 值 。 且 返回 值 必 须 可 转换 为 ResultType。 


效果 
使 用 ResultType 类 型 的 关联 异步 结果 ， 构 造 一 个 std::packaged_task 对 象 ， 异 步 结 果 是 未 就 
绪 的 ， 并 且 Callable 类 型 相关 的 任务 是 对 func 的 一 个 拷贝 。 


抛 出 

当 构 造 函 数 无 法 为 异步 结果 分 配 出 内 存 时 ， 会 抛 出 std::bad alloc 类 型 的 异常 。 其 他 异常 会 
在 使 用 Callable 类 型 的 拷贝 或 移动 构造 过 程 中 抛 出 。 

std::packaged_task 通过 有 分 配器 的 可 调用 对 象 构 造 


使 用 关联 任务 和 异步 结果 ， 构 造 一 个 std::packaged_task 对 象 。 使 用 以 提供 的 分 配器 为 关联 
任务 和 异步 结果 分 配 内 存 。 


声明 


template<typename Allocator, typename Callable> 
packaged_task( 

std::allocator_arg_t, Allocator const& alloc, Callable&& 
func); 


先决 条 件 
表达 式 func(args...) 必须 是 合法 的 ， 并 且 在 args... 中 的 args-i 参 数 ， 必 须 
是 Argtypes... 中 ArgTypes-i 类 型 的 一 个 值 。 且 返回 值 必 须 可 转换 为 ResultType。 


效果 

使 用 ResultType 类 型 的 关联 异步 结果 ， 构 造 一 个 std::packaged_task PR? AY ERARI 
绪 的 ， 并 且 Callable 类 型 相关 的 任务 是 对 func 的 一 个 拷贝 。 蜡 步 结果 和 任务 的 内 存 通 过 内 存 分 
配器 alloc 进 行 分 配 ， 或 进行 捞 贝 。 


抛 出 

当 构 造 了 郧 数 无 法 为 异步 结果 分 配 出 内 存 时 ， 会 抛 出 std::bad_alloc 类 型 的 异常 。 其 他 异常 会 
在 使 用 Callable 类 型 的 拷贝 或 移动 构造 过 程 中 抛 出 。 

std::packaged_task 移动 构造 函数 


通过 一 个 std: :packaged_task 对 象 构建 另 一 个 ， 将 与 已 存在 的 std::packaged_task 相 关 的 异 
步 结果 和 任务 的 所 有 权 转 移 到 新 构建 的 对 象 当 中 。 


声明 


packaged_task(packaged_task&& other) noexcept; 


效果 
构建 一 个 新 的 std::packaged_task 实例 。 


后 置 条 件 
通过 other 构建 新 的 std: :packaged_task 对 象 。 在 新 对 象 构建 完成 后 ，other 与 其 之 前 相关 联 的 
异步 结果 就 没有 任何 关系 了 。 


抛 出 

无 

std::packaged_task 移动 赋值 操作 

将 一 个 std: :packaged_task 对 象 相关 的 异步 结果 的 所 有 权 转 移 到 另外 一 个 。 


声明 


packaged_task& operator=(packaged_task&& other) noexcept; 


将 other 相关 异步 结果 和 任务 的 所 有 权 转 移 到 *this 中 ， 并 且 切 断 异 步 结 果 和 任务 与 other 对 象 
的 关联 ， 如 同 std: :packaged_task(other).swap(*this) ° 


后 置 条 件 
与 other 相关 的 异步 结果 与 任务 移动 转移 ， 使 #his.other 无 关联 的 异步 结果 。 


std::packaged_task::swap 成 员 有 函数 
将 两 个 std: :packaged_task 对 象 所 关联 的 异步 结果 的 所 有 权 进 行 交换 。 


声明 


void swap(packaged_task& other) noexcept; 
将 other 和 *this 关 联 的 异步 结果 与 任务 进行 交换 。 


后 置 条 件 
将 与 other 关联 的 异步 结果 和 任务 ， 通 过 调用 swap 的 方式 ， 与 *this 相 交换 。 


抛 出 
无 


std::packaged_task 析 构 函数 
销毁 一 个 std::packaged_task Ro 


声明 


~packaged_task(); 


效果 
将 *this 销毁 。 如 果 *this 有 关联 的 异步 结果 ， 并 且 结 果 不 是 一 个 已 存储 的 任务 或 异常 ， 那 
么 异步 结果 状态 将 会 变 为 就 绪 2 伴随 就 绪 的 是 一 个 std::future_error 异常 和 错误 


码 std::future_errc: :broken_promise ° 


抛 出 

无 

std::packaged_task::get_future % i 242 
在 x*this 相 关 异 步 结 果 中 ， 检 索 一 个 std:: future 实例 。 


声明 


std: :future<ResultType> get_future(); 


先决 条 件 
*this 具 有 关联 异步 结果 。 


返回 
一 个 与 *this 关 联 剧 构 结 果 相 关 的 一 个 std::future 实例 。 


抛 出 

如 果 一 个 std::future 已 经 通过 get_future() 获 取 了 异步 结果 ， 在 抛 出 std::future_error 异常 
时 ， 错 误 码 是 std: :future_errc::future_already_retrieved 
std::packaged_task::reset 4 i 42% 

将 一 个 std::packaged_task 对 实例 与 一 个 新 的 异步 结果 相关 联 。 


声明 


void reset(); 


先决 条 件 
*this 具 有 关联 的 异步 任务 。 


效果 
如 同 *this=packaged_task(std::move(f)) ，f 是 *this 中 已 存储 的 关联 任务 。 


Pa B 
如 果 内 存 不 足以 分 配给 新 的 异 构 结果 ， 那 么 将 会 抛 出 std::bad_alloc 类 异常 。 


std::packaged_task::valid 成 员 有 函数 
检查 *this 中 是 都 具有 关联 任务 和 腊 步 结果 。 
声明 
bool valid() const noexcept; 
返回 
当 *this 具 有 相关 任务 和 蜡 步 结构 ， 返 回 true ; 否则 ， 返 回 false 。 


抛 出 
无 


std::packaged_task::operator() 函数 调用 操作 


调用 一 个 std::packaged_task 实例 中 的 相关 任务 ， 并 且 存 储 返 回 值 ， 或 将 异常 存储 到 异常 结 
REP 。 


声明 
void operator()(ArgTypes... args); 


先决 条 件 
*this 具 有 相关 任务 。 


像 INVOKE(func,args...) 那 要 调用 相关 的 函数 flnc。 如 果 返 回 征程 ， 那 么 将 会 存储 到 thjs 相 关 
的 异步 结果 中 。 当 返回 结果 是 一 个 异常 ， 将 这 个 异常 存储 到 this 相 关 的 异步 结果 中 。 

后 置 条 件 

*this 相 关联 的 异步 结果 状态 为 就 绪 ， 并 且 存 储 了 一 个 值 或 异常 。 所 有 阻塞 线程 ， 在 等 待 到 异 
步 结 果 的 时 候 被 解除 阻塞 。 

抛 出 

当 异 步 结果 已 经 存储 了 一 个 值 或 异常 ， 那 么 将 抛 出 一 个 std: :future_error 异常 ， 错 误 码 

为 std: :future_errc::promise_already_satisfied ° 

同步 

std: :future<ResultType>: :get() 或 std::shared_ future<ResultType>: :get() 的 成 功 调用 2 代表 
同步 操作 的 成 功 ， 函 数 将 会 检索 异步 结果 中 的 值 或 异常 。 


std::packaged_task::make_ready_at_thread_exit A i 42 


调用 一 个 std::packaged_task 实例 中 的 相关 任务 ， 并 且 存 储 返 回 值 ， 或 将 异常 存储 到 异常 结 
果 当 中 ， 直 到 线程 退出 时 ， 将 相关 异步 结果 的 状态 置 为 就 绪 。 


声明 


void make_ready_at_thread_exit(ArgTypes... args); 


先决 条 件 
*this 具 有 相关 任务 


像 INVOKE(func,args...) 那 要 调用 相关 的 函数 func。 如 果 返 回 征程 ， 那 么 将 会 存储 到 *this 相 
关 的 异步 结果 中 。 当 返 返回 结果 是 一 个 异常 ， 将 这 个 异常 存储 到 *this 相关 的 异步 结果 中 。 当 
当前 线程 退出 的 时 候 ， 可 调配 相关 异步 状态 为 就 绪 。 


后 置 条 件 
xthis 的 异步 结果 中 已 经 存储 了 一 个 值 或 一 个 异常 ， 不 过 在 当前 线程 退出 的 时 候 ， 这 个 结果 都 
是 非 就 绪 的 。 当 当前 线程 退出 时 ， 阻 塞 等 待 异 步 结 果 的 线程 将 会 被 解除 阻塞 。 


抛 出 
当 异 步 结果 已 经 存储 了 一 个 值 或 异常 ， 那 么 将 抛 出 一 个 std: :future_error 异常 ， 错 误 码 
为 std: :future_errc::promise_already_satisfied ° 4 无 关联 异步 状态 时 ， 抛 


出 std::future_error 异常 > 错误 码 为 std::future_errc::no_state ° 
同步 


std: :future<ResultType>::get() 或 std::shared_ future<ResultType>: :get() 在 线程 上 的 成 功 调 


用 ， 代 表 同 步 操作 的 成 功 ， 函 数 将 会 检索 异步 结果 中 的 值 或 异常 。 


D.4.4 std::promise 类 型 模板 


std::promise 类 型 模板 提供 设置 异步 结果 的 方法 ， 这 样 其 他 线程 就 可 以 通过 std::future È 
例 | 来 索引 该 该 结果 


ResultType 模 板 参 数 ， 该 类 型 可 以 存储 异步 结果 


std::promise 实例 Ii A srd: :future 实例 相关 联 ， 并 且 可 以 通过 调用 

get future() 成 员 有 函数 来 获取 这 个 srd::future 实例 。ResultType 类 型 的 异步 结果 ， 
set_value() 成 员 sn 行 设置 ， 或 者 使 用 set exception() 将 对 应 异常 设置 进 异 步 结 
中 。 


std: :promise 实例 是 可 以 MoveConstructible( 移 动 构造 ) 和 MoveAssignable( 移 动 赋值 )， 但 是 
不 能 CopyConstructible( 拷 贝 构造 ) 和 CopyAssignable( 拷 贝 赋值 ) 。 


ed 


定义 


template<typename ResultType> 
class promise 


{ 
public: 
promise(); 
promise(promise&&) noexcept; 
~promise(); 
promise& operator=(promise&&) noexcept; 


template<typename Allocator> 
promise(std::allocator_arg_t, Allocator const&); 


promise(promise const&) = delete; 
promise& operator=(promise const&) = delete; 


void swap(promise& ) noexcept; 
std::future<ResultType> get_future(); 
void set_value(see description); 


void set_exception(std::exception_ptr p); 


ty 


std::promise 默认 构造 函数 
构造 一 个 std: :promise xt Bo 


声明 


promise(); 


使 用 ResultType 类 型 的 相关 异步 结果 来 构造 std::promise 实例 ， 不 过 异步 结果 并 未 就 绪 。 


抛 出 
当 没 有 足够 内 存 为 异步 结果 进行 分 配 那么 将 抛 出 std: :bad_alloc 型 异常 


std::promise 带 分 配器 的 构造 函数 


构造 一 个 std: :promise 对 象 ， 使 用 提供 的 分 配器 来 为 相关 异步 结果 分 配 内 存 。 
声明 


template<typename Allocator> 
promise(std::allocator_arg_t, Allocator const& alloc); 


使 用 ResultType 类 型 的 相关 异步 结果 来 构造 std::promise 实例 ， 不 过 异步 结果 并 未 就 绪 。 异 
步 结 果 的 内 存 由 alloc 分 配器 来 分 配 。 


an 
当 分 配器 为 异步 结果 分 配 内 存 时 ， 如 有 抛 出 异常 ， 就 为 该 函数 抛 出 的 异常 。 


std::promise 移动 构造 函数 


通过 另 一 个 已 存在 对 象 ， 构 造 一 个 std: :promise 对 象 。 将 已 存在 对 象 中 的 相关 异步 结果 的 所 
有 权 转 移 到 新 创建 的 std: :promise 对 象 当 中 。 


声明 


promise(promise&& other) noexcept; 


构造 一 个 std::promise 实例 。 


后 置 条 件 
当 使 用 other 来 构造 一 个 新 的 实例 ， 那 么 other 中 相关 弄 构 结果 的 所 有 权 将 转移 到 新 创建 的 对 痊 
上 。 之 后 ，other 将 无 关联 异步 结果 


抛 出 
无 


std::promise 移动 赋值 操作 符 
在 两 个 std::promise 实例 中 转移 异步 结果 的 所 有 权 。 


声明 


promise& operator=(promise&& other) noexcept; 


在 other 和 *this 之 间 进 行 异 步 结 果 所 有 权 的 转移 。 当 *this 已 经 有 关联 的 异步 结果 ， 那 么 该 
异步 结果 的 状态 将 会 为 就 绪 态 ， 且 伴随 一 个 std::future error 类 型 异常 ， 错 误 码 


为 std: :future_errc::broken_promise ° 


后 置 条 件 
将 other 中 关联 的 异步 结果 转移 到 x*this 当 中 。other 中 将 无 关联 异步 结果 。 


std::promise::swap "X ii % žk 
将 两 个 std::promise 实例 中 的 关联 异步 结果 进行 交换 。 


声明 


void swap(promise& other); 


交换 other 和 *this 当 中 的 关联 异步 结果 。 


后 置 条 件 
当 Sswap 使 用 other 时 ，other 中 的 异步 结果 就 会 与 #this 中 关联 异步 结果 相交 换 。 二 者 返回 来 亦 


抛 出 
无 


std::promise 析 构 函数 
销毁 std::promise 对 象 。 


声明 


~promise(); 


效果 
销毁 *this 。 当 *this 具有 关联 的 异步 结果 ， 并 且 结 果 中 没有 存储 值 或 开 常 ， 那 么 结果 将 会 


置 为 就 绪 ， 伴 随 一 个 std: :future_error 异常 ， 错 误 码 为 std: :future_errc::broken_promise ° 
抛 出 

无 

std::promise::get_future % i % žr 

通过 *this 关 联 的 异步 结果 ， 检 索 出 所 要 的 std::future 实例 。 


声明 


std::future<ResultType> get_future(); 


先决 条 件 

*this 具 有 关联 异步 结果 。 

返回 

与 *this 关 联 异 步 结 果 关 联 的 std::future 实例 。 

抛 出 

当 std::future 已 经 通过 get future() 获 取 过 了 ， 将 会 抛 出 一 个 std: :future_error 类 型 异常 ， 


伴随 的 错误 码 为 std::future_errc::future_already_retrieved ° 
std::promise::set_value % i 243 
存储 一 个 值 到 与 *this 关 联 的 异步 结果 中 。 
声明 
void promise<void>::set_value(); 
void promise<R&>::set_value(R& r); 


void promise<R>::set_value(R const& r); 
void promise<R>::set_value(R&& r); 


先决 条 件 
*this 具 有 关联 异步 结果 。 


效果 
当 ResultType 不 是 void 型 ， 就 存储 r 到 *this 相 关 的 异步 结果 当中 。 


后 置 条 件 
*this 相 关 的 蜡 步 结 果 的 状态 为 就 绪 ， 且 将 值 丰 入。 任意 等 待 异步 结果 的 阻塞 线程 将 解除 阻 
Ro 


抛 出 

当 措 步 结果 已 经 存 有 一 个 值 或 一 个 异常 那么 将 抛 出 std::future_error 型 异常 ? 伴随 着 误 码 
为 std: :future_errc::promise already_satisfied ° [的 拷贝 构造 或 移动 构造 抛 出 的 异常 2 Bp Ay 
本 函数 抛 出 的 异常 。 


同步 

并 发 调用 set_value() 和 set_exception() 的 线程 将 被 序列 化 。 要 想 成 功 的 调用 set_exception()， 
需要 在 之 前 调 用 std::future<Result- 

Type>: :get() 或 std::shared_future<ResultType>::get() ? 这 两 个 函数 将 会 查找 已 存储 a) 


he 


™ o 


std::promise::set_value_at_thread_exit 成 员 有 函数 
存储 一 个 值 到 与 his 关 联 的 异步 结果 中 ， 到 线程 退出 时 ， 异 步 结果 的 状态 会 被 设置 为 就 绪 。 


声明 


void promise<void>::set_value_at_thread_exit(); 

void promise<R&>::set_value_at_thread_exit(R& r); 
void promise<R>::set_value_at_thread_exit(R const& r); 
void promise<R>::set_value_at_thread_exit(R&& r); 


先决 条 件 
*this 具 有 关联 异步 结果 。 


当 ResultType 不 是 void 型 ， 就 存储 r 到 *this 相 关 的 异步 结果 当中 。 标 记 异 步 结 果 为 “已 存储 值 "。 
当前 线程 退出 时 ， 会 安排 相关 弄 步 结果 的 状态 为 就 绪 。 


后 置 条 件 
将 值 存 入 *this 相 关 的 异步 结果 ， 且 直到 当前 线程 退出 时 ， 腊 步 结果 状态 被 置 为 就 绪 。 任 何等 
待 异步 结果 的 阻塞 线程 将 解除 阻塞 。 


抛 出 

当 异 步 结果 已 经 存 有 一 个 值 或 一 个 异常 ， 那 么 将 抛 出 std::future_error 型 异常 ， 伴 随 错 误 码 
为 std: :future_errc::promise_already_satisfied ° [的 拷贝 构造 或 移动 构造 抛 出 的 异常 Bp Ay 
本 函数 抛 出 的 异常 。 


同步 

并 发 调用 set value(), set_value_at_thread_exit(), set_ exception() 和 

set exception_at_ thread _exit() 的 线程 将 被 序列 化 。 要 想 成 功 的 调用 Set_exception()， 需 要 在 
之 前 调用 std: :future<Result-Type>::get() 或 std::shared_future<ResultType>::get() ? 这 两 
个 函数 将 会 查找 已 存储 的 异常 。 


std::promise::set_exception È i $% žk 


存储 一 个 异常 到 与 *this 关 联 的 异步 结果 中 。 


声明 


void set_exception(std::exception_ptr e); 


先决 条 件 

x*this 具 有 关联 异步 结果 。(bool)e 为 true。 

将 e 存 储 到 *this 相 关 的 异步 结果 中 。 

后 置 条 件 

在 存储 异常 后 ，*this 相 关 的 异步 结果 的 状态 将 置 为 继续 。 任 何等 待 异 步 结 果 的 阻塞 线程 将 解 

除 阻塞 。 

抛 出 

当 异 步 结 果 已 经 存 有 一 个 值 或 一 个 异常 那么 将 抛 出 std::future_error 型 异常 ?, 伴随 着 误 码 
为 std: :future_errc::promise_already_satisfied ° 

同步 

并 发 调用 set_value() 和 set_exception() 的 线程 将 被 序列 化 。 要 想 成 功 的 调用 set_exception()， 
需要 在 之 前 调用 std::future<Result- 


Type>: :get() 或 std::shared_future<ResultType>::get() ? 这 两 个 函数 将 会 查找 已 存储 a) 
党 


™ o 


std::promise::set_exception_at_thread_exit ™ ii 4% 
BAKES this ž KAD ERP > ois HRB o AY RREA RA © 


声明 


void set_exception_at_thread_exit(std::exception_ptr e); 


先决 条 件 
x*this 具 有 关联 异步 结果 。(bool)e 为 true 。 


效果 
将 e 存 储 到 *this 相 关 的 异步 结果 中 。 标 记 异步 结 果 为 "已 存储 值 "。 当 前 线程 退出 时 ， 会 安排 相 
关 异 步 结果 的 状态 为 就 绪 。 


后 置 条 件 
将 值 存 入 #this 相 关 的 异步 结果 ， 且 直到 当前 线程 退出 时 ， 异 步 结果 状态 被 置 为 就 绪 。 任 何等 
待 异 步 结果 的 阻塞 线程 将 解除 阻塞 。 


抛 出 
当 异 步 结 果 已 经 存 有 一 个 值 或 一 个 异常 2 那么 将 抛 出 std::future_error 型 异常 伴随 着 误 码 


为 std: :future_errc: :promise_already_satisfied ° 


同步 

并 发 调用 set value(), set_value_at_thread_exit(), set_ exception() 和 

set_exception_at_ thread _exit() 的 线程 将 被 序列 化 。 要 想 成 功 的 调用 Set_exception()， 需 要 在 
之 前 调用 std: :future<Result-Type>::get() 或 std::shared_future<ResultType>::get() ? 这 两 
个 函数 将 会 查找 已 存储 的 异常 。 


D.4.5 std::async 了 有 函数 模板 


std::async 能 够 简 单 的 使 用 可 用 的 硬件 并 行 来 运行 自 身 包含 的 异步 任务 。 当 调 
用 std::async 返回 一 个 包含 任务 结果 的 std: :future 对 象 。 根 据 投 放 策 略 ， 任 务 在 其 所 在 线 
程 上 是 异步 运行 的 ， 当 有 线程 调用 了 这 个 future 对 象 的 wait() 和 get() 成 员 函 数 ， 则 该 任务 会 同 


y= pe 


步 运行 。 


Sa 


明 


二 


enum class launch 


{ 
async, deferred 

J; 

template<typename Callable,typename ... Args> 

future<result_of<Callable(Args...)>::type> 

async(Callable&& func,Args&& ... args); 

template<typename Callable, typename ... Args> 

future<result_of<Callable(Args...)>::type> 

async(launch policy, Callable&& func,Args&& ... args); 
先决 条 件 


表达 式 INVOKE(func, args) 能 都 为 finc 提 供 合法 的 值 和 args。Callable 和 Args 的 所 有 成 员 都 可 
MoveConstructible( 可 移动 构造 )。 


效果 
在 内 部 存储 中 拷贝 构造 func 和 arg... (分 别 使 用 人 f 和 xyz... 进 行 表 示 )。 


当 policy 是 std::launch::async , 运行 INVOKE(fff, xyz...) 在 所 在 线程 上 。 当 这 个 线程 完成 时 
返回 的 std::future 状态 将 会 为 就 绪 态 ， 并 且 之 后 会 返回 对 应 的 值 或 异 常 (由 调用 HA Ho wh) 。 
析 构 函数 会 等 待 返回 的 std: :future 相关 异步 状态 为 就 绪 时 ， 才 解除 阻塞 。 


当 policy 是 std::launch::deferred ， 俐 和 Xyx... 都 会 作为 延期 函数 调用 ， 存 储 在 返 
的 std::future 。 首 次 调用 future 的 wait() 或 get() 成 员 兄 数 ， 将 会 共享 相关 状态 ， 之 后 执行 
的 INVOKE(fff,xyz...) 与 调用 wait() 或 get() 函 数 的 线程 同步 执行 。 


执行 INVOKE(fff, xyz.. ， 在 调用 std:: future 的 成 员 函数 get() 时 ， 就 会 有 值 运 MA He 
抛 出 。 


当 policy 是 std::launch::async | std::launch::deferred COs eA 略 ， 其 行为 如 同 已 
指定 的 std::launch::async 或 std::launch::deferred 。 具 体 实 现 将 会 通过 乏 渐 递增 的 方式 
(call-by-call basis) 最 大 化 利用 可 用 的 硬件 并 行 ， 并 避免 起 限 分 配 的 问题 。 


在 所 有 的 情况 下 ， std: :async 调用 都 会 直接 返回 。 


同步 

完成 函数 调用 的 先行 条 件 是 ， 需 要 通过 调用 std::future 和 std::shared_future 实例 的 
wait(),get(),wait for() 或 wait_until()， 和 返回 的 对 象 与 std::async 返回 的 std::future 对 象 关 联 
的 状态 相同 才 算 成 功 。 就 std::launch::async 这 个 policy 来 说 ， 在 完成 线程 上 的 函数 前 ， 也 需 
要 先行 对 上 面 的 函数 调用 后 ， 成 功 的 返回 才 行 。 


抛 出 
当 内 部 存储 无 法 分 配 所 需 的 空间 ， 将 抛 出 std::bad_alloc 类 型 异常 ; 否则 ， 当 效果 没有 达 
到 ， 或 任何 异常 在 构造 作 和 Xyz... 发 生 时 2 抛 出 std::future_error 异常 S 


D.5 <mutex> 头 文件 


<mutex> 头 文件 提供 互 斥 工具 : 互 太 类 型 ， 锁 类 型 和 函数 ， 还 有 确保 操作 只 执行 一 次 的 机 
制 。 


头 文件 内 容 


namespace std 
{ 
class mutex; 
class recursive_mutex; 
class timed_mutex; 
class recursive_timed_mutex; 


struct adopt_lock_t; 
struct defer_lock_t; 
struct try_to_lock_t; 


constexpr adopt_lock_t adopt_lock{}; 
constexpr defer_lock_t defer_lock{}; 


constexpr try_to_lock_t try_to_lock{}; 


template<typename LockableType> 
class lock_guard; 


template<typename LockableType> 
class unique_lock; 


template<typename LockableType1, typename... LockableType2> 
void lock(LockableType1& m1, LockableType2& m2...); 


template<typename LockableType1, typename... LockableType2> 
int try_lock(LockableType1& m1, LockableType2& m2...); 


struct once_flag; 


template<typename Callable, typename... Args> 
void call_once(once_flag& flag,Callable func,Args args...); 


D.5.1 std::mutex #& 


std: :mutex 类 型 为 线程 提供 基本 的 互 斥 和 同 FLA 2 这 些 工 具 可 以 用 来 保护 共享 数据 9 互 不 
量 可 以 用 来 保护 数据 ， 互 斥 量 上 锁 必 须要 调用 |ok() 或 try_ lock()。 当 有 一 个 线程 获取 已 经 获取 
了 锁 ， 那 么 其 他 线程 想 要 在 获取 锁 的 时 候 ， 会 在 尝试 或 取 锁 的 时 候 失 败 (调用 try_lock()) 或 阻塞 


(调用 lock())， 有 具体 酌情 而 定 。 当 线程 完成 对 共享 数据 的 访问 ， 之 后 就 必须 调用 unlock() 对 锁 进 
行 释放 ， 并 且 人 允许 其 他 线程 来 访问 这 个 共享 数据 。 


std: :mutex #¢ Lockable 49 需求 p 


kè 


class mutex 


{ 
public: 
mutex(mutex const&)=delete; 
mutex& operator=(mutex const&)=delete; 


constexpr mutex() noexcept; 
~mutex(); 


void lock(); 
void unlock(); 
bool try_lock(); 


Jag 


std::mutex 默认 构造 函数 
构造 一 个 std::mutex 对 象 。 


声明 


constexpr mutex() noexcept; 


效果 


构造 一 个 std::mutex 实例 。 


后 置 条 件 
新 构造 的 std::mutex It A Æ KA AY © 


抛 出 
无 


std::mutex 析 构 函数 


销毁 一 个 std::mutex 对 象 。 


声明 


~mutex(); 


先决 条 件 
*this 必 须 是 未 锁 的 。 


效果 
销毁 *this。 


抛 出 

无 

std::mutex::lock 成 员 有 函数 
为 当前 线程 获取 std::mutex 上 的 人 锁 。 


声明 


void lock(); 


先决 条 件 
*this 上 必须 没有 持 有 一 个 锁 。 


效果 
阻塞 当前 线程 ， 知 道 *this 获 取 锁 。 


后 置 条 件 
*this 被 调用 线程 锁 住 。 


抛 出 

当 有 错误 产生 2 P E std::system_error 类 型 异常 5 
std::mutex::try_lock ™ i $% žr 
尝试 为 当前 线程 获取 std: :mutex 上 的 锁 。 


声明 


bool try_lock(); 


先决 条 件 
*this 上 必须 没有 持 有 一 个 锁 。 


效果 
尝试 为 当前 线程 this 获取 上 的 锁 ， 失 败 时 当前 线程 不 会 被 阻塞 。 


返回 
当 调 用 线程 获取 锁 时 ， 返 回 true。 


后 置 条 件 
当 *this 被 调用 线程 锁 住 ， 则 返回 true 。 


抛 出 无 


NOTE 该 函数 在 获取 锁 时 ， 可 能 失败 (并 返回 false)， 即 使 没有 其 他 线程 持 有 *this 上 的 锁 。 


std::mutex::unlock 成 员 有 函数 
释放 当前 线程 获取 的 std::mutex 锁 。 


声明 


void unlock(); 


先决 条 件 
*this 上 必须 持 有 一 个 锁 。 


效果 释放 当前 线程 获取 到 *this 上 的 锁 。 任 意 等 待 获取 *this 上 的 线程 ， 会 在 该 函数 调用 后 
解除 阻塞 。 


后 置 条 件 
调用 线程 不 在 拥有 *this 上 的 锁 。 


抛 出 
无 


D.5.2 std::recursive_ mutex 关 


std: :recursive_mutex 类 型 为 线程 提供 基本 的 互 斥 和 同 步 工具 ， 可 以 用 来 保护 共享 数据 。 互 不 
量 可 以 用 来 保护 数据 ， 互 斥 量 上 锁 必须 要 调用 |lok() 或 try_lock()。 当 有 一 个 线程 获取 已 经 获取 
了 锁 ， 那 么 其 他 线程 想 要 在 获取 锁 的 时 候 ， 会 在 尝试 或 取 锁 的 时 候 失 败 (调用 try_lock()) 或 阻塞 
(调用 lock())， 具 体 酌 情 而 定 。 当 线程 完成 对 共享 数据 的 访问 ， 之 后 就 必须 调用 unlock() 对 人 锁 进 
行 释放 ， 并 且 人 允许 其 他 线程 来 访问 这 个 共享 数据 。 


这 个 互 矿 量 是 可 递归 的 ， 所 以 一 个 线程 获取 std: :recursive_mutex 后 可 以 在 之 后 继续 使 用 
lock() 或 try lock() 来 增加 锁 的 计数 。 只 有 当 线 程 调 用 unlock 释 放 锁 ， 其 他 线程 才 可 能 用 lock() 或 
try_lock() 获 取 锁 。 


std::recursive_mutex 符合 Lockable 的 需 求 


Hs 


类 型 定义 


class recursive_mutex 


{ 

public: 
recursive_mutex(recursive_mutex const&)=delete; 
recursive_mutex& operator=(recursive_mutex const&)=delete; 


recursive_mutex() noexcept; 
~recursive_mutex(); 


void lock(); 
void unlock(); 
bool try_lock() noexcept; 


int 


std::recursive_mutex 默认 构造 函数 
构 造 一 个 std::recursive_mutex 对 象 $ 


声明 


recursive _mutex() noexcept; 


效果 


构造 一 个 std::recursive_mutexX 实例 © 


后 置 条 件 
新 构造 的 std::recursive_mutex 对 象 是 未 锁 的 K 


抛 出 

当 无 法 创建 一 个 新 的 std::recursive mutex 时 ， 抛 出 sta: :system_error 异常 。 
std::recursive_mutex 析 构 函数 

销 毁 一 个 std: :recursive_mutex 对 象 2 


声明 


~recursive_mutex(); 


先决 条 件 
*this 必 须 是 未 锁 的 。 


效果 
销毁 *this。 


He B 

无 

std::recursive_mutex::lock % i 43 
为 当前 线程 获取 std::recursive mutex 上 的 锁 。 


声明 


void lock(); 
效果 
阻塞 线程 ， 直 到 获取 *this 上 的 锁 。 


先决 条 件 
调用 线程 锁 住 加 1S 上 的 锁 。 当 调用 已 经 持 有 一 个 this 的 锁 时 ， 锁 的 计数 会 增加 1 。 


抛 出 

当 有 错误 产 生 ， 将 抛 出 std::system error 异常 9 
std::recursive_mutex::try_lock X i 3 
尝试 为 当前 线程 获取 std: :recursive_mutex 上 的 锁 ° 


声明 


bool try_lock() noexcept; 


BR 
尝试 为 当前 线程 :this 获 取 上 的 锁 ， 失 败 时 当前 线程 不 会 被 阻塞 


o 


返回 
当 调 用 线程 获取 锁 时 ， 返 回 true ; SM] > false 。 


后 置 条 件 
当 x*this 被 调用 线程 锁 住 ， 则 返回 true。 


抛 出 无 

NOTE 该 函数 在 获取 锁 时 ， 当 函数 返回 true 时 ，*this 上 对 销 的 计数 会 加 一 。 如 果 当 前 线程 还 
未 获取 *this 上 的 锁 ， 那 么 该 函数 在 获取 锁 时 ， 可 能 失败 (并 返回 false)， 即 使 没有 其 他 线程 持 
有 *this 上 的 锁 。 

std::recursive_mutex::unlock 7% i % žr 

释放 当前 线程 获取 的 std::recursive_mutexX 倘 


声明 


void unlock(); 


先决 条 件 
*this 上 必须 持 有 一 个 锁 。 


效果 释放 当前 线程 获取 到 *this 上 的 锁 。 如 果 这 是 *this 在 当前 线程 上 最 后 一 个 锁 ， 那 么 任 
意 等 待 获取 *this 上 的 线程 ， 会 在 该 函数 调用 后 解除 其 中 一 个 线程 的 阻塞 。 

后 置 条 件 

*this 上 锁 的 计数 会 在 该 函数 调用 后 减 一 。 


抛 出 
无 


D.5.3 std::timed mutex 关 


std::timed_mutex 类 型 在 std: :mutex KES Fe 同 步 工具 的 基础 上 ， 让 人 锁 支持 超时 : LFS 
可 以 用 来 保护 数据 ， 互 斥 量 上 锁 必 须要 调用 |ok(),try_lock_for(), 或 try_lock_until()。 当 有 一 个 线 
程 获 取 已 经 获取 了 锁 ， 那 么 其 他 线程 想 要 在 获取 锁 的 时 候 ， 会 在 尝试 或 取 锁 的 时 候 失败 (调用 
try_lock()) 或 阻塞 (调用 lock())， 或 直到 想 要 获取 锁 可 以 获取 ， 亦 或 想 要 获取 的 锁 超时 (调用 
try_lock_for() 或 try_lock_until())。 在 线程 调用 unlock() 对 锁 进行 释放 ， 其 他 线程 才能 获取 这 个 
锁 被 获取 (不 管 是 调用 的 哪个 函数 ) 。 


std::timed_mutex 符合 TimedLockable 的 需求 。 


类 型 定义 


class timed_mutex 


{ 

public: 
timed_mutex(timed_mutex const&)=delete; 
timed_mutex& operator=(timed_mutex const&)=delete; 


timed_mutex(); 
~timed_mutex(); 


void lock(); 
void unlock(); 
bool try_lock(); 


template<typename Rep, typename Period> 
bool try_lock_for( 
std::chrono: :duration<Rep, Period> const& relative_time); 


template<typename Clock, typename Duration> 
bool try_lock_until( 
std::chrono: :time_point<Clock,Duration> const& 
absolute_time); 


ie 


std::timed_mutex 默认 构造 函数 
构造 一 个 std::timed_mutex 对 象 。 


声明 


timed_mutex(); 


效果 


构造 一 个 std::timed_mutex 实例 。 


后 置 条 件 
新 构造 一 个 未 上 锁 的 std::timed mutex 对 象 。 


抛 出 
当 无 法 创建 出 新 的 std::timed_mutex 实例 时 ， 抛 出 std::system error 类 型 异常 。 


std::timed_mutex 析 构 函数 
销毁 一 个 std::timed_mutex 对 象 。 


声明 


~timed_mutex(); 


先决 条 件 
*this 必 须 没 有 上 人 锁 。 


效果 
销毁 *this。 


抛 出 

无 

std::timed_mutex::lock X i 42% 
为 当前 线程 获取 std::timed_mutex 上 的 锁 。 


声明 


void lock(); 


先决 条 件 
调用 线程 不 能 已 经 持 有 ithis 上 的 锁 。 


效果 
阻塞 当前 线程 ， 直 到 获取 到 *this 上 的 锁 。 


后 置 条 件 
*this 被 调用 线程 锁 住 。 


Pa B 

当 有 错误 产生 抛 出 std::system_error 类 型 异常 z 
std::timed_mutex::try_lock % i % žr 
尝试 获取 为 当前 线程 获取 std::timed mutex 上 的 锁 。 


声明 


bool try_lock(); 


先决 条 件 
调用 线程 不 能 已 经 持 有 ithis 上 的 锁 。 


效果 
尝试 获取 *this 上 的 锁 ， 当 获取 失败 时 ， 不 阻塞 调用 线程 。 


返回 
当 锁 被 调用 线程 获取 ， 返 回 true ; 反之 ， 返 回 false 。 


后 置 条 件 
4 AA E A true > *this I we 2 wy Ay FEAE © 


抛 出 
无 


NOTE 即使 没有 线程 已 获取 *this 上 的 锁 ， 函 数 还 是 有 可 能 获取 不 到 锁 (并 返回 false)。 


std::timed_mutex::try_lock_for % i % žr 
尝试 获取 为 当前 线程 获取 std::timed mutex 上 的 锁 。 


声明 


template<typename Rep, typename Period> 
bool try_lock_for( 
std::chrono: :duration<Rep, Period> const& relative_time); 


先决 条 件 
调用 线程 不 能 已 经 持 有 *this 上 的 锁 。 


在 指定 的 relative_time 时 间 内 ， 党 试 获取 *this 上 的 锁 。 当 relative_time.count() 为 0 或 负数 ， 将 
会 立即 返回 ， 就 像 调用 try lock() 一 样 。 否 则 ， 将 会 阻塞 ， 直 到 获取 锁 或 超过 给 定 的 
relative_time 的 时 间 。 

返回 

当 锁 被 调用 线程 获取 ， 返 回 true ; 反之 ， 返 回 false 。 


后 置 条 件 
当 遂 数 返 回 为 true，*this 则 被 当前 线程 锁 住 。 


抛 出 
无 


NOTE 即使 没有 线程 已 获取 *this 上 的 锁 ， 函 数 还 是 有 可 能 获取 不 到 锁 (并 返回 false)。 线 程 阻塞 
的 时 长 可 能 会 长 于 给 定 的 时 间 。 逝 去 的 时 间 可 能 是 由 一 个 稳定 时 钟 所 决定 。 
std::timed_mutex::try_lock_until X i % žr 
尝试 获取 为 当前 线程 获取 std: :timed mutex 上 的 锁 。 
声明 

template<typename Clock, typename Duration> 

bool try_lock_until( 


std::chrono: :time_point<Clock, Duration> const& 
absolute_time); 


先决 条 件 
调用 线程 不 能 已 经 持 有 ithis 上 的 锁 。 


在 指定 的 absolute _ time 时 间 内 ， 党 试 获取 *this 上 的 锁 。 当 absolute_time<=Clock::now() 时 ， 
将 会 立即 返回 ， 就 像 调用 try_lock() 一 样 。 否 则 ， 将 会 阻塞 ， 直 到 获取 锁 或 Clock::now() 返 回 的 
时 间 等 于 或 超过 给 定 的 absolute_ time 的 时 间 。 

返回 

当 倘 被 调用 线程 获取 ， 返 回 true ; 反之 ， 返 回 false。 

后 置 条 件 

4 HARE A true’ *this | tk 2 ATRIA © 


抛 出 
无 


NOTE 即使 没有 线程 已 获取 *this 上 的 锁 ， 函 数 还 是 有 可 能 获取 不 到 锁 (并 返回 false)。 这 里 不 保 
证 调用 函数 要 阻塞 多 久 ， 只 有 在 函数 返回 false 后 ， 在 Clock::now() 返 回 的 时 间 大 于 或 等 于 
absolute_ time 时 ， 线 程 才 会 接触 阻塞 。 

std::timed_mutex::unlock 7% i $% žr 

将 当前 线程 持 有 std::timed mutex 对 象 上 的 锁 进 行 释放 。 


声明 


void unlock(); 


先决 条 件 
调用 线程 已 经 持 有 *this 上 的 锁 。 


效果 

当前 线程 释放 *this 上 的 锁 。 任 一 阻塞 等 待 获 取 *this 上 的 线程 ， 将 被 解除 阻塞 。 
后 置 条 件 

*this 未 被 调用 线程 上 锁 。 


抛 出 
无 


D.5.4 std::recursive_timed_mutex 关 


std: :recursive_timed_mutex 类 型 在 std::recursive_mutex 提供 的 互 斥 和 同 步 工具 的 基础 上 2 
让 锁 支 持 超时 。 互 矿 量 可 以 用 来 保护 数据 ， 互 斥 量 上 锁 必 须要 调用 lok(),try_lock for(), 或 
try_lock_until()。 当 有 一 个 线程 获取 已 经 获取 了 锁 ， 那 么 其 他 线程 想 要 在 获取 锁 的 时 候 ， 会 在 
尝试 或 取 锁 的 时 候 失败 (调用 try_lock()) 或 阻塞 (调用 lock())， 或 直到 想 要 获取 锁 可 以 获取 ， 亦 或 
想 要 获取 的 锁 超时 (调用 try_lock for() 或 try_lock_until())。 在 线程 调用 unlock() 对 锁 进 行 释放 ， 
其 他 线程 才能 获取 这 个 锁 被 获取 (不 管 是 调用 的 哪个 函数 ) 。 


该 互 斥 量 是 可 递归 的 ， 所 以 获取 std::recursive_timed_mutex 锁 的 线程 ， 可 以 多 次 的 对 该 实例 
上 的 锁 获取 。 所 有 的 锁 将 会 在 调用 相关 unlock() 操 作 后 ， 可 由 其 他 线程 获取 该 实例 上 的 锁 。 


std::recursive timed mutex 符合 TimedLockable 的 需 求 g 


类 型 定义 


class recursive_timed_mutex 


{ 
public: 
recursive_timed_mutex( recursive timed mutex const&)=delete; 
recursive_timed_mutex& operator=(recursive_timed_mutex 
const&)=delete; 


recursive_timed_mutex(); 
~recursive_timed_mutex(); 


void lock(); 
void unlock(); 
bool try_lock() noexcept; 


template<typename Rep, typename Period> 
bool try_lock_for( 
std::chrono: :duration<Rep, Period> const& relative_time); 


template<typename Clock, typename Duration> 
bool try_lock_until( 
std::chrono: :time_point<Clock,Duration> const& 
absolute_time); 


ia 


std::recursive_timed_mutex 默认 构造 函数 
构 造 一 个 std: :recursive_timed_mutex 对 象 8 


声明 


recursive_timed_mutex(); 


BR 


构造 一 个 std::recursive_timed_mutex 实例 ® 
后 置 条 件 


新 构造 的 std::recursive_timed_mutex 实例 是 没有 L4 的 © 


抛 出 


当 无 法 创建 一 个 std: :recursive_ timed mutex 实例 时 ， 抛 出 std: :system_error 类 异常 


std::recursive_timed_mutex 析 构 函数 
析 构 一 个 std: :recursive_timed_mutex 对 象 


声明 
~recursive_timed_mutex(); 


先决 条 件 
*this 不 能 上 锁 。 


效果 
销毁 *this。 


抛 出 

Ja 

std::recursive_timed_mutex::lock 74 i $% žk 
为 当 前 线程 获取 std: :recursive_timed_mutex 对 象 上 的 锁 9 


声明 
void lock(); 


先决 条 件 
*this 上 的 锁 不 能 被 线程 调用 。 


效果 
阻塞 当前 线程 ， 直 到 获取 *this 上 的 锁 。 


后 置 条 件 
*this 被 调用 线程 锁 住 。 当 调用 线程 已 经 获取 *this 上 的 锁 ， 那 么 锁 的 计数 会 再 增加 1 。 


抛 出 

当 错 误 出 现时 ， 抛 出 std::system_error 类 型 异常 。 
std::recursive_timed_mutex::try_lock ™ i $% žk 
尝试 为 当前 线程 获取 std::recursive_timed_mutex 对 象 上 的 锁 。 


声明 


bool try_lock() noexcept; 


尝试 获取 *this 上 的 锁 ， 当 获取 失败 时 ， 直 接 不 阻塞 线程 。 
返回 
当 调 用 线程 获取 了 锁 ， 返 回 true， 否则 返回 false 。 


后 置 条 件 
+ HRREtrue’ *this 会 被 调用 线程 锁 住 。 


抛 出 
无 


NOTE 该 函数 在 获取 锁 时 ， 当 部 数 返 回 true 时 ， *this 上 对 锁 的 计数 会 加 一 。 如 果 当 前 线程 还 


未 获取 *this 上 的 锁 ， 那 么 该 函数 在 获取 锁 时 ， 可 能 失败 (并 返回 false)， 即 使 没有 其 他 线程 持 
有 *this 上 的 锁 。 


std::recursive_timed_mutex::try_lock_for 成 员 有 函数 
党 试 为 当 前 线程 获取 std::recursive timed mutex 对 象 上 的 锁 a 


声明 


template<typename Rep, typename Period> 
bool try_lock_for( 
std::chrono: :duration<Rep, Period> const& relative_time); 


在 指定 时 间 relative_time 内 ， 尝 试 为 调用 线程 获取 *this 上 的 锁 。 当 relative_time.count() 为 0 或 
负数 时 ， 将 会 立即 返回 ， 就 像 调用 try lock() 一 样 。 否 则 ， 调 用 会 阻塞 ， 直 到 获取 相应 的 锁 ， 
或 超出 了 relative_time 时 限时 ， 调 用 线程 解除 阻塞 。 


返回 
当 调 用 线程 获取 了 锁 ， 返 回 true， 否 则 返回 false。 


后 置 条 件 
当 函 数 返回 true， *this 会 被 调用 线程 锁 住 。 


抛 出 
无 


NOTE 该 函数 在 获取 锁 时 ， 当 有 函数 返回 true 时 ， *this 上 对 锁 的 计数 会 加 一 。 如 果 当 前 线程 还 
未 获取 «this 上 的 锁 ， 那 么 该 函数 在 获取 锁 时 ， 可 能 失败 (并 返回 false)， 即 使 没有 其 他 线程 持 
有 *this 上 的 锁 。 等 待 时 间 可 能 要 上 比 指 定 的 时 间 长 很 多 。 逝 去 的 时 间 可 能 由 一 个 稳定 时 钟 来 


we 


计算 。 


std::recursive_timed_mutex::try_lock_until % 7 42 
尝试 为 当 前 线程 获取 std::recursive_timed_mutex 对 象 上 的 锁 Q 


声明 


template<typename Clock, typename Duration> 

bool try_lock_until( 
std::chrono::time_point<Clock, Duration> const& 

absolute_time); 


BOR 

在 指定 时 间 absolute _ time 内， 尝试 为 调用 线程 获取 *this 上 的 锁 。 当 

absolute time<=Clock::now() 时 ， 将 会 立即 返回 ， 就 像 调 用 try_lock() 一 样 。 否 则 ， 调 用 会 阻 
塞 ， 直 到 获取 相应 的 锁 ， 或 Clock::now() 返 回 的 时 间 大 于 或 等 于 absolute_ time 时 ， 调 用 线程 解 


返回 
当 调 用 线程 获取 了 锁 ， 返 回 true， 和 否则 返回 false 。 


后 置 条 件 
+ RAA true’? *this 会 被 调用 线程 锁 住 。 


抛 出 
无 


NOTE 该 函数 在 获取 锁 时 ， 当 函数 返回 true 时 ， *this 上 对 锁 的 计数 会 加 一 。 如 果 当 前 线程 还 
未 获取 this 上 的 锁 ， 那 么 该 函数 在 获取 锁 时 ， 可 能 失败 (并 返回 false)， 即 使 没有 其 他 线程 持 
有 *this 上 的 锁 。 这 里 阻塞 的 时 间 并 不 确定 ， 只 有 当 函 数 返回 false， 然 后 Clock::now() 返 回 的 
时 间 大 于 或 等 于 absolute_ time 时， 调用 线程 将 会 解除 阻塞 。 
std::recursive_timed_mutex::unlock 成 员 有 函数 

释放 当前 线程 获取 到 的 std::recursive_timed_mutex 上 的 锁 。 


声明 


void unlock(); 


效果 
当前 线程 释放 *this 上 的 锁 。 当 *this 上 最 后 一 个 锁 被 释放 后 ， 任 何等 待 获取 *this 上 的 锁 
将 会 解除 阻塞 ， 不 过 只 能 解除 其 中 一 个 线程 的 阻塞 。 


后 置 条 件 
调用 线程 his 上 锁 的 计数 减 一 。 


抛 出 
无 


D.5.5 std::lock guard 类 型 模板 


std::lock_guard 类 型 模板 为 基础 锁 包 装 所 有 权 。 所 要 上 锁 的 互 斥 量 类 型 ， 由 模板 参数 Mutex 

RRL? HALA SLockablesy ER o HLM AG SE BAP LM > LAT BAP AB 
$i o RRA LA SMBS RAGE T DMR AK ; 当 程 序 运行 完成 时 ， 阻 塞 解除 ， 互 斤 
量 解 锁 (无 论 是 执行 到 最 后 ， 还 是 通过 控制 流 语 名 break 或 return， 亦 或 是 抛 出 异常 ) 。 


std::lock_guard 是 不 可 MoveConstructible( 移 动 构造 ) CopyConstructible( 拷 贝 构造 ) 和 
CopyAssignable( 找 贝 赋值 ) 。 


ed 


template <class Mutex> 
Class lock_guard 
{ 
public: 
typedef Mutex mutex_type; 


explicit lock_guard(mutex_type& m); 
lock_guard(mutex_type& m, adopt_lock_t); 
~lock_guard(); 


lock_guard(lock_guard const& ) = delete; 
lock_guard& operator=(lock_guard const& ) = delete; 


ti 


std::lock_guard 自动 上 锁 的 构造 函数 


使 用 互 斤 量 构造 一 个 std: :lock_guard 实例 。 


声明 


explicit lock_guard(mutex_type& m); 


效果 
通过 引用 提供 的 互 不 量 ， 构 造 一 个 新 的 std: :lock_guard 实例 ， 并 调用 m.lock()。 


抛 出 
m.lock() 抛 出 的 任何 异常 。 


后 置 条 件 

*this 拥 有 m 上 的 锁 。 

std::lock_guard 获取 锁 的 构造 函数 

使 用 已 提供 互 斤 量 上 的 锁 ， 构 造 一 个 std::lock_guard 实例 。 


声明 


lock_guard(mutex_type& m,std::adopt_lock_t); 


先决 条 件 
调用 线程 必须 拥有 m 上 的 锁 。 


效果 
调用 线程 通过 引用 提供 的 互 斥 量 ， 以 及 获取 m 上 锁 的 所 有 权 ， 来 构造 一 个 新 
的 std::lock_guard 实例 。 


抛 出 
无 


后 置 条 件 
*this 拥 有 m 上 的 锁 。 


std::lock_guard 析 构 函数 
销毁 一 个 std::lock_guard 实例 ， 并 且 解 锁 相 关 互 斥 量 。 


声明 


~lock_guard(); 


当 *this 被 创建 后 ， 调 用 m.unlock()。 


抛 出 
无 


D.5.6 std::unique lock 类 型 模板 


std: :unique_lock 类 型 模板 相 较 std: :loc_guard 提供 了 更 通用 的 所 有 权 包装 器 。 上 和 锁 的 互 斤 
量 可 由 模板 参数 Mutex 提 供 ， 这 个 类 型 必须 满足 BasicLockable 的 需求 。 虽 然 ， 通 常情 况 下 ， 
制定 的 互 斥 量 会 在 构造 的 时 候 上 锁 ， 析 构 的 时 候 解 锁 ， 但 是 附加 的 构造 函数 和 成 员 咏 数 提供 
灵活 的 功能 。 互 斥 量 上 锁 ， 意 味 着 对 操作 同一 段 代码 的 线程 进行 阻塞 ; 当 互 斥 量 解锁 ， 就 意 
味 着 阻塞 解除 (不 论 是 裕 兴 到 最 后 ， 还 是 使 用 控制 语句 break 和 return， 亦 或 是 抛 出 弄 

常 ) ° std::condition_variable 的 邓 和 丹 函 数 是 需要 std: :unique_lock<std: :mutex> 实例 的 ， 并 
且 所 有 std: :unique_lock 实例 都 适用 于 std: :conditin_variable_any  4F hA 4 Lockable # 
数 。 


当 提 供 的 Mutex 类 型 符合 Lockable 的 需 求 > ABA std: :unique_lock<Mutex> 也 是 符合 Lockable 
的 需求 。 此 外 ， 如 果 提 供 的 Mutex 类 型 符合 TimedLockable 的 需求 ， 那 
么 std::unique_lock<Mutex> 也 符合 TimedLockable 的 需求 。 


izd 


std: :unique_lock 实例 是 MoveConstructible( 移 动 构 造 ) 和 MoveAssignable( 移 动 赋值 )， 但 是 
不 能 CopyConstructible( 拷 贝 构造 ) 和 CopyAssignable( 拷 贝 赋值 ) 。 


类 型 定义 


template <class Mutex> 
class unique_lock 
{ 
public: 
typedef Mutex mutex_type; 


unique_lock() noexcept; 

explicit unique_lock(mutex_type& m); 
unique_lock(mutex_type& m, adopt_lock_t); 
unique_lock(mutex_type& m, defer_lock_t) noexcept; 
unique_lock(mutex_type& m, try_to_lock_t); 


template<typename Clock,typename Duration> 
unique_lock( 
mutex_type& m, 


std::chrono: :time_point<Clock,Duration> const& 
absolute_time); 


template<typename Rep, typename Period> 
unique_lock( 
mutex_type& m, 
std::chrono: :duration<Rep, Period> const& relative_time); 


~unique_lock(); 


unique_lock(unique_lock const& ) = delete; 
unique_lock& operator=(unique_lock const& ) = delete; 


unique_lock(unique_lock&& ); 
unique_lock& operator=(unique_lock&& ); 


void swap(unique_lock& other) noexcept; 


void lock(); 
bool try_lock(); 
template<typename Rep, typename Period> 
bool try_lock_for( 
std::chrono: :duration<Rep, Period> const& relative_time); 
template<typename Clock, typename Duration> 
bool try_lock_until( 
std::chrono: :time_point<Clock,Duration> const& 
absolute _time); 
void unlock(); 


explicit operator bool() const noexcept; 
bool owns_lock() const noexcept; 

Mutex* mutex() const noexcept; 

Mutex* release() noexcept; 


lar 


std::unique_lock 默认 构造 函数 
不 使 用 相关 互 斤 量 ， 构 造 一 个 std::unique_lock 实例 。 


声明 


unique_lock() noexcept; 


效果 
构造 一 个 std::unique_lock 实例 ， 这 个 新 构造 的 实例 没有 相关 互 斥 量 。 


后 置 条 件 
this->mutex()==NULL, this->owns_lock()==false. 


std::unique_lock 自动 上 锁 的 构造 函数 


使 用 相关 互 不 量 ， 构 造 一 个 std::unique_lock 实例 。 


声明 


explicit unique_lock(mutex_type& m); 


效果 
通过 提供 的 互 不 量 ， 构 造 一 个 std: :unique_lock 实例 ， 且 调用 m.lock()。 


抛 出 
m.lock() 抛 出 的 任何 异常 。 


后 置 条 件 

this->owns_lock()==true, this->mutex()==&m. 
std::unique_lock 获取 锁 的 构造 函数 

使 用 相关 互 斥 量 和 持 有 的 锁 ， 构 造 一 个 std::unique_lock 实例 。 


声明 


unique_lock(mutex_type& m,std::adopt_lock_t); 


先决 条 件 
调用 线程 必须 持 有 m 上 的 锁 。 


效果 
通过 提供 的 互 斥 量 和 已 经 拥有 m 上 的 锁 ， 构 造 一 个 std::unique_lock 实例 。 


抛 出 
无 


后 置 条 件 
this->owns_lock()==true, this->mutex()==&m. 


std::unique_lock 递 延 锁 的 构造 函数 
使 用 相关 互 斥 量 和 非 持 有 的 锁 ， 构 造 一 个 std: :unique_lock 实例 。 


声明 


unique_lock(mutex_type& m,std::defer_lock_t) noexcept; 


效果 

构造 的 std::unique_lock 实例 引用 了 提供 的 互 斥 量 。 
抛 出 

无 

后 置 条 件 


this->owns_lock()==false, this->mutex()==&m. 


std::unique_lock 尝试 获取 和 锁 的 构造 函数 
使 用 提供 的 互 矿 量 ， 并 尝试 从 互 斥 量 上 获取 锁 ， 从 而 构造 一 个 std::unique_lock 实例 。 


声明 


unique_lock(mutex_type& m,std::try_to_lock_t); 


先决 条 件 
使 std::unique_lock 实例 化 的 Mutex 类 型 ， 必 须 符 合 Loackable 的 需求 。 


效果 
构造 的 std::unique_lock 实例 引用 了 提供 的 互 斥 量 ， 且 调用 m.try_lock()。 


抛 出 
无 


后 置 条 件 
this->owns_lock() 将 返回 m.try_lock() 的 结果 ， 且 this->mutex()==&m ° 


std::unique_lock 在 给 定时 长 内 尝试 获取 锁 的 构造 函数 


使 用 提供 的 互 矿 量 ， 并 尝试 从 互 斥 量 上 获取 锁 ， 从 而 构造 一 个 std::unique_lock 实例 。 


声明 


template<typename Rep, typename Period> 
unique_lock( 
mutex_type& m, 
std::chrono: :duration<Rep, Period> const& relative_time); 


先决 条 件 
使 std::unique_lock 实例 化 的 Mutex 类 型 ， 必 须 符 合 TimedLockable 的 需求 。 


构造 的 std::unique_lock 实例 引用 了 提供 的 互 斥 量 ， 且 调用 m.try_lock_for(relative_time)。 


抛 出 
无 


后 置 条 件 
this->owns_lock() 将 返回 m.try_lock_for() 的 结果 ， 且 this->mutex()==&m ° 


std::unique_lock 在 给 定时 间 点 内 尝试 获取 锁 的 构造 函数 
使 用 提供 的 互 矿 量 ， 并 尝试 从 互 斥 量 上 获取 锁 ， 从 而 构造 一 个 std::unique_lock 实例 。 
声明 
template<typename Clock, typename Duration> 
unique_lock( 
mutex_type& m, 


std::chrono: :time_point<Clock, Duration> const& 
absolute_time); 


先决 条 件 
使 std::unique_lock 实例 化 的 Mutex 类 型 ， 必 须 符 合 TimedLockable 的 需求 。 


效果 
构造 的 std::unique_lock 实例 引用 了 提供 的 互 斥 量 ， 且 调用 m.try_lock_until(absolute_time)。 


抛 出 
无 


后 置 条 件 
this->owns_lock() 将 返回 m.try_lock_until() 的 结果 ， 且 this->mutex()==&m ° 


std::unique_lock 移动 构造 函数 
将 一 个 已 经 构造 std::unique_lock 实例 的 所 有 权 ， 转 移 到 新 的 std::unique_lock 实例 上 去 。 


声明 


unique_lock(unique_lock&& other) noexcept; 


先决 条 件 

使 std::unique_lock 实例 化 的 Mutex 类 型 ， 必 须 符 合 TimedLockable 的 需求 。 

构造 的 std::unique_lock 实例 。 当 other 在 函数 调用 的 时 候 拥 有 互 斥 量 上 的 锁 ， 那 么 该 锁 的 所 
有 权 将 被 转移 到 新 构建 的 std: :unique_lock 对 象 当 中 去 。 


后 置 条 件 

对 于 新 构建 的 std::unique_lock 对 象 X，X.mutex 等 价 与 在 构造 函数 调用 前 的 othermutex()， 
并 且 x.Owns_lock() 等 价 于 函数 调用 前 的 otherowns lock()。 在 调用 有 函数 后 ， 
other.mutex()==NULL > other.owns_lock()=false ° 


抛 出 
无 


NOTE std: :unique_lock 对 象 是 不 可 CopyConstructible( 找 贝 构造 )， 所 以 这 里 没有 找 贝 构造 
函数 ， 只 有 移动 构造 函数 。 

std::unique_lock 移动 赋值 操作 

将 一 个 已 经 构造 std: :unique_lock 实例 的 所 有 权 ， 转 移 到 新 的 std: :unique_lock 实例 上 去 。 


声明 


unique_lock& operator=(unique_lock&& other) noexcept; 


当 this->owns_lock() 返 回 true 时 ， 调 用 this->unlock()。 如 果 other 拥 有 mutex 上 的 锁 ， 那 么 这 个 
所 将 归 *this 所 有 。 


后 置 条 件 
this->mutex() 等 于 在 为 进行 赋值 前 的 other.mutex()， 并 且 this->owns_lock() 的 值 与 进行 赋值 操 
作 前 的 other.owns_lock() 相 等 。other.mutex()==NULL, other.owns_lock()==false ° 


抛 出 
无 


NOTE std: :unique_lock 对 象 是 不 可 CopyAssignable( 拷 贝 赋值 )， 所 以 这 里 没有 拷贝 赋值 了 
数 ， 只 有 移动 赋值 函数 。 


std::unique_lock #7 #4 4 %& 


= 


o 


销毁 一 个 std::unique_lock E4] > te RÈ SC fol AA ZI > AR AAAA KAR E A RG 


声明 


~unique_lock(); 
4 this->owns_lock()24 E/true#t > 4] M this->mutex()->unlock() ° 
抛 出 
无 
std::unique_lock::swap % i $% žr 
交换 std::unique_lock 实例 中 相关 的 所 有 权 。 


声明 


void swap(unique_lock& other) noexcept; 


如 果 other 在 调用 该 函数 前 拥有 互 斥 量 上 的 锁 ， 那 么 这 个 锁 将 归 *this PTA ° wR *this EH 
用 哎 函 数 前 拥有 互 上 斥 量 上 的 锁 ， 那 么 这 个 锁 将 归 other 所 有 。 


抛 出 

Ja 

std::unique_lock 上 非 成 员 有 函数 swap 
交换 std::unique_lock 实例 中 相关 的 所 有 权 。 


声明 


void swap(unique_lock& lhs,unique_lock& rhs) noexcept; 


lhs.swap(rhs) 


抛 出 
无 


std::unique_lock::lock i $% žk 
获取 与 *this 相 关 互 斥 量 上 的 锁 。 


声明 


void lock(); 


先决 条 件 

this->mutex()!=NULL, this->owns_lock()==false. 

7 M this->mutex()->lock() ° 

抛 出 

抛 出 任何 this->mutex()->lock() 所 抛 出 的 异常 。 当 this->mutex()==NULL， 抛 

出 std: :sytem_error 类 型 异常 ， 错 误 码 为 std: :errc: :operation_not_permitted ° % this- 
>owns_lock()==true 时 ， 抛 出 std::system_error ， 错 误 码 


为 std::errc::resource_deadlock_would_occur ° 


后 置 条 件 

this->owns_lock()==true ° 
std::unique_lock::try_lock ™% i 4% 
尝试 获取 与 *this 相 关 互 斥 量 上 的 锁 。 


声明 


bool try_lock(); 


先决 条 件 
std: :unique_lock 实例 化 说 是 用 的 Mutex 类 型 ， 必 须 满足 Lockable 需 求 。this- 
>mutex()!=NULL, this->owns_lock()==false ° 


7 M this->mutex()->try_lock() ° 


抛 出 

抛 出 任何 this->mutex()->try_lock() 所 抛 出 的 异常 。 当 this->mutex()==NULL， 抛 

出 std::sytem_error 类 型 异常 ， 错 误 码 为 std::errc::operation_not_permitted ° ¥ this- 
>owns_lock()==true 时 ， 抛 出 std::system error ， 错 误 码 


为 std::errc::resource_deadlock_would_occur ° 


后 置 条 件 
4 % 324 Eltruely > this->ows_lock()==true > @ #'this->owns_lock()==false ° 


std::unique_lock::unlock 成 员 有 函数 
释放 与 *this 相 关 互 斥 量 上 的 锁 。 


声明 


void unlock(); 


先决 条 件 
this->mutex()!=NULL, this->owns_lock()==true ° 


抛 出 
抛 出 任何 this->mutex()->unlock() 所 抛 出 的 异常 。 当 this->owns_lock()==false 时 ， 抛 


出 std: :system_error ， 错误 码 为 std::errc: :operation_not_permitted ° 


后 置 条 件 
this->owns_lock()==false ° 


std::unique_lock::try_lock_for à i 8% 
在 指定 时 间 内 尝试 获取 与 *this 相 关 互 不 量 上 的 锁 。 
声明 

template<typename Rep, typename Period> 


bool try_lock_for( 
std::chrono: :duration<Rep, Period> const& relative_time); 


先决 条 件 
std::unique_lock 实例 化 说 是 用 的 Mutex 类 型 ， 必 须 满足 TimedLockable 需 求 。this- 
>mutex()!=NULL, this->owns_lock()==false ° 


7 M this->mutex()->try_lock_for(relative_time) ° 


返回 

4 this->mutex()->try_lock_for():4 "true > 3% Eltrue > & MA Elfalse ° 

抛 出 

抛 出 任何 this->mutex()->try_lock_for() 所 抛 出 的 异常 。 当 this->mutex()==NULL， 抛 

出 std: :sytem_error 类 型 异常 > 错误 码 为 std: :errc: :operation_not_permitted ° % this- 
>owns_lock()==truelt > 741K std::system_error ， 错 误 码 


A std::errc::resource_deadlock_would_occur ° 


后 置 条 件 
4 3% 324 Eltruely{ > this->ows_lock()==true > & #'this->owns_lock()==false ° 


std::unique_lock::try_lock_until * i 42 
在 指定 时 间 点 党 试 获取 与 *this 相 关 互 矿 量 上 的 锁 。 


声明 


template<typename Clock, typename Duration> 
bool try_lock_until( 

std::chrono: :time_point<Clock, Duration> const& 
absolute_time); 


先决 条 件 
std::unique_lock 实例 化 说 是 用 的 Mutex 类 型 ， 必 须 满足 TimedLockable 需 求 。this- 
>mutex()!=NULL, this->owns_lock()==false ° 


7 M this->mutex()->try_lock_until(absolute_time) ° 

返回 

4 this->mutex()->try_lock_for():4 "true > 3% Eltrue > & M4 Elfalse ° 

Pa h 

抛 出 任何 this->mutex()->try_lock_for() 所 抛 出 的 异常 。 当 this->mutex()==NULL， 抛 

出 std::sytem_error 类 型 异常 ， 错 误 码 为 std::errc::operation_not_permitted ° ¥ this- 
>owns_lock()==true 时 ， 抛 出 std::system error ， 错 误 码 


为 std::errc::resource_deadlock_would_occur ° 


后 置 条 件 
4 % 324 Eltruel > this->ows_lock()==true > & M this->owns_lock()==false ° 


std::unique_lock::operator bool ii % 4 


检查 *this 是 否 拥有 一 个 互 斥 量 上 的 锁 。 


声明 


explicit operator bool() const noexcept; 


返回 
this->owns_lock() 


抛 出 
无 


NOTE 这 是 一 个 explicit 转 换 操作 ， 所 以 当 这 样 的 操作 在 上 下 文中 只 能 被 隐 式 的 调用 ， 所 返回 


的 结果 需要 被 当做 一 个 布尔 量 进行 使 用 ， 而 非 仅仅 作为 整 型 数 0 或 1。 


std::unique_lock::owns_lock 7% ii $% žr 
检查 *this 是 否 拥 有 一 个 互 斥 量 上 的 锁 。 


声明 


bool owns_lock() const noexcept; 
返回 
当 *this 持 有 一 个 互 斥 量 的 锁 ， 返 回 true ; 否则 ， 返 回 false。 
抛 出 
无 
std::unique_lock::mutex 7% i 4 žr 
Sth HAWKE RSH > RAKES 


声明 
mutex_type* mutex() const noexcept; 


返回 
当 *this 有 相关 互 斥 量 ， 则 返回 该 互 斥 量 ; 和 否则， 返回 NULL ° 


抛 出 
无 


std::unique_lock::release 成 员 有 函数 
当 xthis 具 有 相关 互 斥 量 时 ， 返 回 这 个 互 太 量 ， 并 将 这 个 互 斥 量 进行 释放 。 


声明 


mutex_type* release() noexcept; 


效果 
将 *this 与 相关 的 互 斥 量 之 间 的 关系 解除 ， 同 时 解除 所 有 持 有 人 锁 的 所 有 权 。 


返 
返回 与 *this 相 关 的 互 斥 量 指 针 ， 如 果 没 有 相关 的 互 斥 量 ， 则 返回 NULL。 


后 置 条 件 
this->mutex()==NULL, this->owns_lock()==false ° 


抛 出 
无 


NOTE 如 果 this->owns_lock() 在 调用 该 函数 前 返回 true， 那 么 调用 者 则 有 责任 里 解除 互 斥 量 上 
的 锁 。 


D.5.7 std::lock % 2c 4% tz 


std::lock 函数 模板 提供 同时 锁 住 多 个 互 斥 量 的 功能 ， 且 不 会 有 因 改 变 锁 的 一 致 性 而 导致 的 
死 锁 。 


声明 


template<typename LockableTypei, typename... LockableType2> 
void lock(LockableType1& m1, _LockableType2& m2...); 


先决 条 件 
提供 的 可 锁 对 象 LockableType1, LockableType2...， 需 要 满足 Lockable 的 需求 。 


效果 
使 用 未 指定 顺序 调用 lock(),try_lock() 获 取 每 个 可 锁 对 象 (m1, m2...) 上 的 锁 ， 还 有 unlock() 成 员 
来 避免 这 个 类 型 陷入 死 锁 。 


后 置 条 件 
当前 线程 拥有 提供 的 所 有 可 锁 对 象 上 的 锁 。 


抛 出 
任何 lock(), try_lock() 和 unlock() 抛 出 的 异常 。 


NOTE 如 果 一 个 异常 由 std::lock 所 传播 开 来 ， 当 可 锁 对 象 上 有 人 锁 被 lock() 或 try_lock() 获 取 ， 
那么 Unlock() 会 使 用 在 这 些 可 锁 对 象 上 。 


D.5.8 std::try lock 有 函数 模板 


std: :try_lock 函数 模板 允许 尝试 获取 一 组 可 锁 对 象 上 的 锁 ， 所 以 要 不 全 部 获取 ， 要 不 一 个 都 
不 获取 。 


声明 


template<typename LockableTypei, typename... LockableType2> 
int try_lock(LockableType1& m1,LockableType2& m2...); 


先决 条 件 
提供 的 可 锁 对 象 LockableType1, LockableType2...， 需 要 满足 Lockable 的 需求 。 


使 用 try lock() 尝 试 从 提供 的 可 锁 对 象 m1,m2... 上 束 个 获取 锁 。 当 锁 在 之 前 获取 过 ， 但 被 当前 
线程 使 用 unlock() 对 相关 可 锁 对 象 进行 了 释放 后 ，try_lock() 会 返回 false 或 抛 出 一 个 异常 。 
返回 

当 所 有 锁 都 已 获取 (每 个 互 斥 量 调用 try_lock() 返 回 true)， 则 返回 -1， 否 则 返回 以 0 为 基数 的 数 
字 ， 其 值 为 调用 try_lock() 返 回 false 的 个 数 。 


后 置 条 件 
当 肠 数 返回 -1， 当 前 线程 获取 从 每 个 可 锁 对 象 上 都 获取 一 个 锁 。 否 则 ， 通 过 该 调用 获取 的 任何 
锁 都 将 被 释放 。 


抛 出 
try_lock() 抛 出 的 任何 异常 。 


NOTE 如 果 一 个 异常 由 std::try_lock 所 传播 开 来 ， 则 通过 try_lock() 获 取 锁 对 象 ， 将 会 调用 
unlock() 解 除 对 锁 的 持 有 。 
D.5.9 std::once flag 关 


std::once_flag 和 std::call_once 一 起 使 用 ， 为 了 保证 某 特 定 函 数 只 执行 一 次 (即使 有 多 个 线 
程 在 并 发 的 调用 该 函数 ) 。 


std::once_flag 实例 是 不 能 CopyConstructible( 拷 贝 构 造 )，CopyAssignable( 拷 贝 赋值 ) 
MoveConstructible( 移 动 构造 )， 以 及 MoveAssignable( 移 动 赋值 )。 


ed 


struct once_flag 


i 


constexpr once_flag() noexcept; 


once_flag(once_flag const& ) = delete; 
once_flag& operator=(once_flag const& ) = delete; 


ty 


std::once_flag 默认 构造 函数 


std::once_flag 默认 构造 函数 创建 了 一 个 新 的 sta: :once_flag 实例 (并 包含 一 个 状态 ， 冯 个 状 
态 表示 相关 函数 没有 被 调用 ) 。 


声明 


constexpr once_flag() noexcept; 


std: :once_flag 默认 构造 函数 创建 了 一 个 新 的 std: :once_flag 实例 (并 包含 一 个 状态 ， 这 个 状 
态 表 示 相 关 郊 数 没有 被 调用 )。 因 为 这 是 一 个 constexpr 构 造 函 数 ， 在 构造 的 静态 初始 部 分 ， 实 
例 是 静态 存储 的 ， 这 样 就 避免 了 条 件 竞争 和 初始 化 顺序 的 问题 。 


NA ab 
D.5.10 std::call_ once 4 27% #& 
std::call_once 和 std: :once_flag 一 起 使 用 ， 为 了 保证 茶 特定 函数 只 执行 一 次 (即使 有 多 个 线 
程 在 并 发 的 调用 该 函数 ) 。 
声明 


template<typename Callable, typename... Args> 
void call_once(std::once_flag& flag,Callable func,Args args...); 


先决 条 件 
表达 式 INVOKE(func, args) 提供 的 func 和 args 必 须 是 合法 的 。Callable 和 每 个 Args 的 成 员 都 是 
可 MoveConstructible( 移 动 构造 ) 。 


在 同一 个 std::once_flag 对 象 上 调用 std::call_once 是 串 行 的 。 如 果 之 前 没有 在 同一 

个 std::once_flag 对 象 上 调用 过 std::call_once ， 参 数 func( 或 副本 ) 被 调用 ， 就 像 
INVOKE(func, args), 并 且 只 有 可 调用 的 func 不 抛 出 任何 异常 时 ， 调 用 std::call_once 才 是 有 
效 的 。 当 有 异常 抛 出 异常 会 被 调用 Hy HK AT AS 2 如 果 之 前 在 std::once_flag HE 

的 std::call_once 是 有 效 的 ， 那 么 再 次 调用 sta: :call_once 将 不 会 在 调用 func。 

同步 

在 std: :once_flag 上 完成 对 std::call_once 的 调用 的 先决 条 件 是 ， 后 续 所 有 


对 std::call_once 调用 都 在 同一 sta: :once_flag 对 象 。 


抛 出 
当 效 果 没 有 达到 4 或 任何 异常 由 调用 func 而 传播 ， 则 抛 出 std: :system_error ° 


D.6 <ratio> 头 文件 


<ratio> 头 文 件 提供 在 编译 时 进行 的 计算 $ 


头 文件 内 容 


namespace std 

{ 
template<intmax_t N,intmax_t D=1> 
class ratio; 


// ratio arithmetic 
template <class R1, class R2> 
using ratio_add = see description; 


template <class R1, class R2> 
using ratio_subtract = see description; 


template <class R1, class R2> 
using ratio_multiply = see description; 


template <class R1, class R2> 
using ratio_divide = see description; 


// ratio comparison 
template <class R1, class R2> 


struct ratio_equal; 


template <class R1, class R2> 
struct ratio_not_equal; 


template <class R1, class R2> 
struct ratio_less; 


template <class R1, class R2> 
struct ratio_less equal; 


template <class R1, class R2> 


struct ratio_greater; 


template <class R1, class R2> 


struct ratio_greater_equal; 


typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 


ratio<1, 1000000000000000000> atto; 
ratio<1, 1000000000000000> femto; 
ratio<1, 1000000000000> pico; 
ratio<1, 1000000000> nano; 
ratio<1, 1000000> micro; 

ratio<i, 1000> milli; 

ratio<1, 100> centi; 

ratio<i, 10> deci; 

ratio<10, 1> deca; 

ratio<100, 1> hecto; 

ratio<1000, 1> kilo; 
ratio<1000000, 1> mega; 
ratio<1000000000, 1> giga; 
ratio<1000000000000, 1> tera; 
ratio<1000000000000000, 1> peta; 
rati0<1000000000000000000, 1> exa; 


D.6.1 std::ratio 类 型 模板 


std::ratio 类 型 模板 提供 了 一 种 对 在 编译 时 进行 计算 的 机 制 ， 通 过 调用 合理 的 数 ， 例 如 : 半 
( std::ratio<1,2> ),2/3(std::ratio<2, 3="">) 或 15/43(std::ratio<15, 43="">)。 其 使 用 在 C++ 标准 
库 内 部 用 于 初始 化 std::chrono::duration 类 型 模板 9 


* 
kä 


定义 


template <intmax_t N, intmax_t D = 1> 


class ratio 


{ 
public: 
typedef 


ratio<num, den> type; 


static constexpr intmax_t num= see below; 


static constexpr intmax_t den= see below; 


ie 


要 求 

D 不 能 为 0。 

a th 

num 和 和 den 分别 为 分 子 和 人 分母， 构造 分 数 NND。den 总 是 正 数 。 当 N 和 D 的 符号 相同 ， 那 么 num 
ALR: 否则 num 为 负数 。 


例子 
ratio<4,6>::num == 
ratio<4,6>::den == 


ratio<4, -6>::num == -2 
ratio<4, -6>::den == 3 


D.6.2 std::ratio add 模板 别 名 


std::ratio_add 模板 别名 提供 了 两 个 std::ratio 在 编译 时 相 加 的 机 制 (使 用 有 理 计 算 )。 


定义 


template <class R1, class R2> 
using ratio_add = std::ratio<see below>; 


先决 条 件 
R1 和 R2 必 须 使 用 std::ratio 进行 初始 化 。 


效果 

ratio_add 被 定义 为 一 个 别名 ， 如 果 两 数 可 以 计算 ， 且 无 溢出 ， 该 类 型 可 以 表示 两 
std::ratio 对 象 R1 和 R2 的 和 。 如 果 计 算出 来 的 结果 溢出 了 ， 那 么 程序 里 面 就 有 问题 了 。 
在 算术 溢出 的 情况 下 ” std::ratio_add<R1, R2> 应 该 应 该 与 std::ratio<R1::num * R2::den + 


> 


R2::num * R1::den, R1::den * R2::den> 相同 2. 


例子 
std::ratio add<std::ratio<1,3>, std::ratio<2,5> >::num == 11 
std::ratio_add<std::ratio<1,3>, std::ratio<2,5> >::den == 15 
std::ratio_add<std::ratio<1,3>, std::ratio<7,6> >::num == 3 


std::ratio_add<std::ratio<1,3>, std::ratio<7,6> >::den == 2 


D.6.3 std::ratio_subtract 模 板 别名 


std::ratio_subtract 模板 别名 提供 两 个 std::ratio 数 在 编译 时 进行 相 减 (使 用 有 理 计算 )。 


定义 


template <class R1, class R2> 
using ratio_subtract = std::ratio<see below>; 


先决 条 件 
R1 Fe R25 Me Fl std::ratio 进行 初始 化 。 


效果 

ratio_add 被 定义 为 一 个 别名 ， 如 果 两 数 可 以 计算 ， 且 无 溢出 ， 该 类 型 可 以 表示 两 

个 std::ratio 对 象 R1 和 R2 的 和 © 如 果 计 算出 来 的 结果 溢出 To 那么 程序 里 面 就 有 问题 了 Q 
在 算术 溢出 的 情况 下 ” std::ratio_subtract<R1, R2> 应 该 应 该 与 std::ratio<R1i::num * 


R2::den - R2::num * R1i::den, R1::den * R2::den> 相同 2 
例子 
std::ratio_subtract<std::ratio<1,3>, std::ratio<1,5> >::num == 


std::ratio_subtract<std::ratio<1,3>, std::ratio<1,5> >::den == 
aS) 


std::ratio_subtract<std: :ratio<1, 3>, std::ratio<7,6> >::num == 


-5 
std::ratio_subtract<std::ratio<1,3>, std::ratio<7,6> >::den == 


D.6.4 std::ratio_multiply# 7k #4 


std::ratio_multiply 模板 别名 提供 两 个 std::ratio 数 在 编译 时 进行 相 乘 (使 用 有 理 计 算 )。 


定义 


template <class R1, class R2> 
using ratio_multiply = std::ratio<see below>; 


先决 条 件 
R1 和 R2 必 须 使 用 std::ratio 进行 初始 化 。 


ratio_add 被 定义 为 一 个 别名 ， 如 果 两 数 可 以 计算 ， 且 无 溢出 ， 该 类 型 可 以 表示 两 
个 std::ratio 对 象 R1 和 R2 的 和 。 如 果 计 算出 来 的 结果 溢出 那么 程序 里 面 就 有 问题 了 9 
在 算术 溢 出 的 情况 下 ” std::ratio_multiply<R1i, R2> 应 该 应 该 与 std::ratio<R1::num * 


R2::num, R1::den * R2::den> 相同 9 
例子 


std::ratio_multiply<std::ratio<1,3>, std::ratio<2,5> >::num == 
std::ratio_multiply<std::ratio<1,3>, std::ratio<2,5> >::den == 


std::ratio_multiply<std::ratio<1,3>, std::ratio<15,7> >::num == 


std::ratio_multiply<std::ratio<1,3>, std::ratio<15,7> >::den == 


D.6.5 std::ratio_dividet# tk 4 4 


std::ratio_divide 模板 别名 提供 两 个 std::ratio 数 在 编译 时 进行 相 除 (使 用 有 理 计 算 ) 。 
定义 


template <class R1, class R2> 
using ratio_multiply = std::ratio<see below>; 


先决 条 件 
R1 和 R2 必 须 使 用 std::ratio 进行 初始 化 。 


ratio_add 被 定义 为 一 个 别名 ， 如 果 两 数 可 以 计算 ， 且 无 溢出 ， 该 类 型 可 以 表示 两 
std::ratio 对 象 R1 和 R2 的 和 和。 如果 计算 出 来 的 结果 溢出 了 ， 那 么 程序 里 面 就 有 问题 了 。 
在 算术 溢 出 的 情况 下 ” std::ratio_multiply<Ri, R2> 应 该 应 该 与 std::ratio<R1::num * 


> 


R2::num * R2::den, R1::den * R2::den> 相同 ý 


例子 


std: 
std: 


std: 
std: 


‘ratio _divide<std:: 
‘ratio _divide<std: 


‘ratio _divide<std: 
‘ratio _divide<std: 


ratio<1, 3>, 
:ratio<1, 3>, 


:ratio<1, 3>, 
:ratio<1, 3>, 


std:: 
std: 


std: 
std: 


ratio<2,5> >::num 


:ratio<2,5> >::den 


:ratio<15,7> >::num 
:ratio<i5,7> >::den 


D.6.6 std::ratio equal 类 型 模板 


std::ratio_equal 类 型 模板 提供 在 编译 时 比较 两 个 std::ratio 数 (使 用 有 理 计算 )。 


大 


类 型 定义 


template <class R1, class R2> 


class 


ratio_equal: 


public std::integral_constant< 
bool, (R1::num == 


{}; 


先决 条 件 
R1 和 R2 必 须 使 用 std::ratio 进行 初始 化 。 


例 


+ 


std: : 
true 

side 
false 
std: : 
false 
std: : 
true 


ratio_equal<std:: 


ratio_equal<std: 


ratio_equal<std:: 


ratio_equal<std: 


R2::num) && (R1::den == R2::den)> 


ratio<1, 3>, 


:ratio<1, 3>, 


ratio<1, 3>, 


:ratio<1, 3>, 


std: : 


std: 


std: 


std: 


ratio<2, 6> 


:ratio<1, 6> 


:ratio<2, 3> 


:ratio<1, 3> 


D.6.7 std::ratio not equal 类 型 模板 


::value 


::value 


::value 


::value 


std: :ratio_not_equal 类 型 模板 提供 在 编译 时 比较 两 个 std: :ratio 数 (使 用 有 理 计 算 ) © 


类 


Hs 


定义 


45 


template <class R1, class R2> 
class ratio_not_equal: 
public std::integral_constant<bool, !ratio_equal<R1,R2>: :Value> 


{}; 


先决 条 件 
R1 和 R2 必 须 使 用 std::ratio 进行 初始 化 。 


例子 


std::ratio_not_equal<std::ratio<1,3>, std::ratio<2,6> >::value 
== false 

std::ratio_not_equal<std::ratio<1,3>, std::ratio<1,6> >::value 
== true 

std::ratio_not_equal<std::ratio<1,3>, std::ratio<2,3> >::value 
== true 

std: :ratio_not_equal<std::ratio<1,3>, std::ratio<1,3> >::value 
== false 


D.6.8 std::ratio less 类 型 模板 


std::ratio_less 类 型 模板 提供 在 编译 时 比较 两 个 std::ratio 数 (使 用 有 理 计 算 ) 。 


类 型 定义 


template <class R1, class R2> 
class ratio_less: 
public std::integral_constant<bool,see below> 


{}; 


先决 条 件 
R1 和 R22 必须 使 用 std::ratio 进行 初始 化 。 


效果 

std::ratio less 可 通过 std::integral_constant<bool, value > 导出 ， 这 里 value 

为 (R1::num*R2::den) < (R2::num*R1i::den) ° 如 果 有 可 能 ， 需 要 实现 使 用 一 种 机 制 来 避免 计算 
结果 已 出 。 当 溢出 发 生 ， 那 么 程序 中 就 肯定 有 错误 。 


例子 


std::ratio_less<std::ratio<1,3>, std::ratio<2,6> >::value == 
false 
std::ratio_less<std::ratio<1,6>, std::ratio<1,3> >::value == 
true 
std::ratio_less< 

std: :ratio0<999999999, 1000000000>, 

std: :ratio<1000000001,1000000000> >::value == true 
std::ratio_less< 

std: :ratio<1000000001, 1000000000>, 

std: :ratio0<999999999,1000000000> >::value == false 


D.6.9 std::ratio greater 类 型 模板 


std::ratio_greater 类 型 模板 提供 在 编译 时 比较 两 个 std::ratio 数 (使 用 有 理 计 算 ) 。 


Ks 


类 型 定义 
template <class R1, class R2> 
class ratio_greater: 
public std::integral_constant<bool, ratio_less<R2,R1>: :value> 


{}; 


先决 条 件 
R1 和 R22 必须 使 用 std::ratio 进行 初始 化 。 


全 ab 


D.6.10 std::ratio less equal 类 型 模板 


std::ratio_less_equal 类 型 模板 提供 在 编译 时 比较 两 个 std: : ratio 数 (使 用 有 理 计 算 ) x 


Hs 


类 型 定义 
template <class R1, class R2> 
class ratio_less_ equal: 
public std::integral_constant<bool, !ratio_less<R2,R1>::value> 


i}; 


先决 条 件 
R1 和 R2 必 须 使 用 std::ratio 进行 初始 化 。 


D.6.11 std::ratio greater equal 类 型 模板 


std::ratio_greater_equal 类 型 模板 提供 在 编译 时 比较 两 个 std: :ratio 数 (使 用 有 理 计算 ) 。 


es 


类 型 定义 
template <class R1, class R2> 
class ratio_greater_equal: 
public std::integral_constant<bool, !ratio_less<R1,R2>::value> 


{}; 


先决 条 件 
R1 和 R22 必须 使 用 std::ratio 进行 初始 化 。 


D.7 <thread> 头 文件 


<thread> 头 文件 提供 了 管理 和 准 别 线程 的 工具 ， 并 且 提 供 函数 ， 可 让 当前 线程 休眠 。 


头 文件 内 容 


namespace std 


{ 


class thread; 


namespace this_thread 


{ 
thread: :id get_id() noexcept; 


void yield() noexcept; 
template<typename Rep, typename Period> 
void sleep_for( 
std::chrono: :duration<Rep, Period> sleep duration); 
template<typename Clock, typename Duration> 


void sleep_until( 
std::chrono::time_point<Clock, Duration> wake_time); 


D.7.1 std::thread 类 


std: :thread 用 来 管理 线程 的 执行 。 其 提供 让 新 的 线程 执行 或 执行 ， 也 提供 对 线程 的 识别 ， 以 
及 提供 其 他 函数 用 于 管理 线程 的 执行 。 


class thread 
{ 
public: 
// Types 
class id; 
typedef implementation-defined native_handle_type; // optional 


// Construction and Destruction 
thread() noexcept; 
~thread(); 


template<typename Callable, typename Args...> 
explicit thread(Callable&& func,Args&&... args); 


// Copying and Moving 
thread(thread const& other) = delete; 
thread(thread&& other) noexcept; 


thread& operator=(thread const& other) = delete; 
thread& operator=(thread&& other) noexcept; 


void swap(thread& other) noexcept; 
void join(); 

void detach(); 

bool joinable() const noexcept; 

id get_id() const noexcept; 


native_handle_ type native_handle(); 
static unsigned hardware_concurrency() noexcept; 


jr 


void swap(thread& lhs, thread& rhs); 


std::thread::id 类 


| 


以 通过 std::thread::id 实例 对 执行 线程 进行 识别 。 


a 


类 型 定义 


ey 


class thread: :id 


{ 
public: 
id() noexcept; 


}; 


bool operator==(thread::id x, thread::id y) noexcept; 
bool operator!=(thread::id x, thread::id y) noexcept; 
bool operator<(thread::id x, thread::id y) noexcept; 
bool operator<=(thread::id x, thread::id y) noexcept; 
bool operator>(thread::id x, thread::id y) noexcept; 
bool operator>=(thread::id x, thread::id y) noexcept; 


template<typename charT, typename traits> 
basic_ostream<charT, traits>& 
operator<< (basic_ostream<charT, traits>&& out, thread::id id); 


Notes 
std::thread::id 的 值 可 以 识 别 不 同 的 执行 2 每 个 std::thread::id 默认 构造 出 来 的 值 都 不 一 
样 ， 不 同 值 代表 不 同 的 执行 线程 。 


std::thread::id 的 值 是 不 可 预测 的 ， 在 同一 程序 中 的 不 同 线程 的 id 也 不 同 。 

std::thread::id 是 可 以 CopyConstructible( 找 贝 构 造 ) 和 CopyAssignable( 找 贝 赋值 )， 所 以 对 
于 std::thread::id 的 拷贝 和 赋值 是 没有 限制 的 。 
std::thread::id 默认 构造 函数 
构造 一 个 std::thread::id 对 象 ， 其 不 能 表示 任何 执行 线程 。 


声明 


id() noexcept; 
构造 一 个 std::thread::id 实例 ， 不 能 表示 任何 一 个 线程 值 。 


抛 出 
无 


NOTE 所 有 默认 构造 的 std::thread::id 实例 存储 的 同一 个 值 。 


std::thread::id 相等 比较 操作 
比较 两 个 std::thread: :id 的 值 ， 看 是 两 个 执行 线程 是 否 相等 。 
声明 


bool operator==(std::thread::id lhs,std::thread::id rhs) 
noexcept; 


返回 
当 |Ihs 和 rhs 表示 同一 个 执行 线程 或 两 者 不 代表 没有 任何 线程 ， 则 返回 true。 当 |sh 和 rhs 表 示 不 
同 执行 线程 或 其 中 一 个 代表 一 个 执行 线程 ， 另 一 个 不 代表 任何 线程 ， 则 返回 false。 


抛 出 

无 

std::thread::id 不 相等 比较 操作 

比较 两 个 std::thread::id 的 值 ， 看 是 两 个 执行 线程 是 否 相等 。 
声明 


bool operator ! =(std::thread::id lhs,std::thread::id rhs) 
noexcept; 


返回 
! (1hs==rhs) 
抛 出 
无 
std::thread::id 小 于 比较 操作 
比较 两 个 std::thread::id 的 值 ， 看 是 两 个 执行 线程 哪个 先 执行 。 
声明 


bool operator<(std::thread::id lhs,std::thread::id rhs) 
noexcept; 


返回 
当 |hs 比 rhs 的 线程 ID 靠 前 ， 则 返回 true。 当 |Ihsl=rhs， 且 ins<rhs 或 rhs<lhs 返回 true， 其 他 情 
况 则 返回 false 。 当 Ihs==rhs， 在 lhs<rhs 和 rhs<lhs 时 返回 false ° 


抛 出 
无 


NOTE 当 上 默认 构造 的 std::thread::id 实例， 在 不 代表 任何 线程 的 时 候 ， 其 值 小 于 任何 一 个 代 
表 执 行 线程 的 实例 。 当 两 个 实例 相等 ， 那 么 两 个 对 象 代 表 两 个 执行 线程 。 任 何 一 组 不 同 

的 std::thread::id 的 值 ， 是 由 同一 序列 构造 ， 这 和 与 程序 执行 的 顺序 相同 。 同 一 个 可 执行 程序 
可 能 有 不 同 的 执行 顺序 。 

std::thread::id 小 于 等 于 比较 操作 

比较 两 个 std::thread::id 的 值 ， 看 是 两 个 执行 线程 的 |D 值 是 否 相 等 ， 或 其 中 一 个 先行 。 

声明 


bool operator<(std::thread::id lhs,std::thread: :id rhs) 
noexcept; 


返回 
!(rhs<lhs) 
抛 出 
无 
std::thread::id 大 于 比较 操作 
比较 两 个 std::thread::id 的 值 ， 看 是 两 个 执行 线程 的 是 后 行 的 。 
声明 


bool operator>(std::thread::id lhs,std::thread::id rhs) 
noexcept; 


返回 
rhs<lhs 


抛 出 
无 


std::thread::id 大 于 等 于 比较 操作 


比较 两 个 std::thread::id 的 值 ， 看 是 两 个 执行 线程 的 ID 和 值 是 否 相等 ， 或 其 中 一 个 后 行 。 
声明 


bool operator>=(std::thread::id lhs,std::thread::id rhs) 
noexcept; 


返回 
!(1hs<rhs) 
抛 出 
无 
std::thread::id 插入 流 操作 
将 std::thread::id 的 值 通过 给 指定 流 写 入 字符 串 。 
声明 
template<typename charT, typename traits> 


basic_ostream<charT, traits>& 
operator<< (basic_ostream<charT, traits>&& out, thread::id id); 


将 std::thread::id 的 值 通过 给 指定 流 插 入 字符 串 。 


返回 
无 


NOTE 字符 串 的 格式 并 未 给 定 。 std::thread::id 实例 具有 相同 的 表达 式 时 ， 是 相同 的 ; SSK 
例 表 达 式 不 同 ， 则 代表 不 同 的 线程 。 


std::thread::native_handler % i & 2 


> 


native_handle_type 是 由 另 一 类 型 定义 而 来 ， 这 个 类 型 会 随 着 指定 平台 的 API 而 变化 。 


声明 


typedef implementation-defined native_handle_type; 


NOTE 这 个 类 型 定义 是 可 选 的 。 如 果 提 供 ， 实 现 将 使 用 原生 平台 指定 的 API， 并 提供 合适 的 类 
型 作为 实现 。 


std::thread 默认 构造 函数 
返回 一 个 native_handle_type 类 型 的 值 ， 这 个 值 可 以 可 以 表示 *this 相 关 的 执行 线程 。 


声明 


native_handle_type native_handle(); 
NOTE 这 个 函数 是 可 选 的 。 如 果 提 供 ， 会 使 用 原生 平台 指定 的 API， 并 返回 合适 的 值 。 


std::thread 构造 函数 
构造 一 个 无 相关 线程 的 std::thread 对 象 。 


声明 


thread() noexcept; 


构造 一 个 无 相关 线程 的 std::thread 实例 。 


后 置 条 件 
对 于 一 个 新 构造 的 std::thread 对 象 X，Xx.get id() == id()。 


抛 出 

无 

std::thread 移动 构造 函数 

将 已 存在 std::thread 对 象 的 所 有 权 ， 转 移 到 新 创建 的 对 象 中 。 


声明 


thread(thread&& other) noexcept; 


构造 一 个 std::thread 实例 。 与 other 相关 的 执行 线程 的 所 有 权 ， 将 转移 到 新 创建 
的 std::thread 对 和 象 上 。 否 则 ， 新 创建 的 std::thread 对 象 将 无 任何 相关 执行 线程 。 


后 置 条 件 
对 于 一 个 新 构建 的 std::thread 对 象 X 来 说 ， Xx.get_id() 等 价 于 未 转移 所 有 权时 的 
other.get_id() ° get_id()==id() ° 


抛 出 
无 


NOTE std::thread 对 象 是 不 可 CopyConstructible( 拷 贝 构 造 )， 所 以 该 类 没有 拷贝 构造 函数 ， 
只 有 移动 构造 函数 。 

std::thread 析 构 函数 

销毁 std::thread IA ° 


声明 


~thread(); 


销毁 *this 。 当 *this 与 执行 线程 相关 (this->joinable() 将 返回 true)， 调 
用 std::terminate() 来 终止 程序 。 


抛 出 

无 

std::thread 移动 赋值 操作 

将 一 个 std::thread 的 所 有 权 ， 和 转移 到 另 一 个 std::thread 对 象 上 。 


声明 


thread& operator=(thread&& other) noexcept; 


在 调用 该 函数 前 ，this->joinable 返 回 true， 则 调用 std::terminate() 来 终止 程序 。 当 other 在 
执行 赋值 前 ， 具 有 相关 的 执行 线程 ， 那 么 执行 线程 现在 就 与 *this 相关 联 。 否 则 ， *this 无 
相关 执行 线程 。 


后 置 条 件 
this->get_id()49 4a T 74 Fl 1% & žx ay 4 other.get_id() ° oter.get_id()==id() ° 


抛 出 
无 


NOTE std: :thread 对 象 是 不 可 CopyAssignable( 找 贝 赋值 )， 所 以 该 类 没有 拷贝 赋值 函数 ， 只 
有 移动 赋值 函数 。 


std::thread::swap 7% i $% žk 
将 两 个 std::thread 对 象 的 所 有 权 进 行 交 换 。 


声明 


void swap(thread& other) noexcept; 


当 other 在 执行 赋值 前 ， 具 有 相关 的 执行 线程 ， 那 么 执行 线程 现在 就 与 “this 相关 联 。 否 
M > *this 无 相关 执行 线程 。 对 于 *this 也 是 一 样 。 


后 置 条 件 
this->get_id() 的 值 等 于 调用 该 函数 前 的 other.get_id()。other.get_id() 的 值 等 于 没有 调用 元 数 前 
this->get_id() 的 值 。 


抛 出 

无 

std::thread 的 非 成 员 有 函数 swap 
将 两 个 std::thread 对 象 的 所 有 权 进 行 交 换 。 


声明 


void swap(thread& lhs, thread& rhs) noexcept; 


lhs.swap(rhs) 


抛 出 
无 


std::thread::joinable 7% ii % žr 
查询 *this 是 否 具有 相关 执行 线程 。 


声明 


bool joinable() const noexcept; 


返回 
如 果 *this 具 有 相关 执行 线程 ， 则 返回 true ; 和 否则， 返回 false。 


抛 出 

无 

std::thread::join $ i B%& 
等 待 *this 相 关 的 执行 线程 结束 。 

声明 

void join(); 

先决 条 件 


this->joinable() 返 回 true。 


阻塞 当前 线程 ， 直 到 与 *his 相 关 的 执行 线程 执行 结束 。 


后 置 条 件 
this->get_id()==id()。 与 *this 先 关 的 执行 线程 将 在 该 函数 调用 后 结束 。 


同步 
想 要 在 #his 上 成 功 的 调用 该 函数 ， 则 需要 依赖 有 joinable() 的 返回 。 


抛 出 

当 效 果 没 有 达到 或 this->joinable() 返 回 false， 则 抛 出 std::system_error 异常 。 
std::thread::detach È ii 4&4 

将 *this 上 的 相关 线程 进行 分 离 。 


声明 


void detach(); 


先决 条 件 
this->joinable() 返 回 true。 


将 *this 上 的 相关 线程 进行 分 离 。 


后 置 条 件 
this->get_id()==id(), this->joinable()==false 


与 *this 相 关 的 执行 线程 在 调用 该 函数 后 就 会 分 离 ， 并 且 不 在 会 与 当前 std::thread 对 象 再 相 
Fo 


抛 出 

当 效 果 没 有 达到 或 this->joinable() 返 回 false， 则 抛 出 std::system_error 异常 。 
std::thread::get_id X ii %2& 

返回 std::thread::id 的 值 来 表示 *this 上 相关 执行 线程 。 


声明 
thread: :id get_id() const noexcept; 


返回 
当 *this 具 有 相关 执行 线程 ， 将 返回 std::thread::id 作为 识别 当前 函数 的 依据 。 否 则 ， 返 回 默 
认 构 造 的 std::thread::id ° 


抛 出 

无 

std::thread::hardware_concurrency 4? & 7% ih BA 
返回 硬件 上 可 以 并 发 线程 的 数量 。 


声明 
unsigned hardware_concurrency() noexcept; 


返回 
硬件 上 可 以 并 发 线程 的 数量 。 这 个 值 可 能 是 系统 处 理 器 的 数量 。 当 信息 不 用 或 只 有 定义 ， 则 
该 函数 返回 0 © 


抛 出 
无 


D.7.2 this_thread 命 名 空间 


这 里 介绍 一 下 std::this_thread 命名 空间 内 提供 的 函数 操作 。 


this_thread::get_id 非 成 员 有 函数 
返回 std::thread::id 用 来 识别 当前 执行 线程 。 
声明 
thread: :id get_id() noexcept; 
返回 
可 通过 std:thread::id 来 识别 当前 线程 。 
抛 出 
天 
this_thread::yield 非 成 员 有 函数 
该 函数 用 于 通知 库 ， 调 用 线程 不 需要 立即 运行 。 一 般 使 用 小 循环 来 避免 消耗 过 多 CPU 时 间 。 


声明 


void yield() noexcept; 


BR 
使 用 标准 库 的 实现 来 安排 线程 的 一 些 事情 。 


Pa h 
无 
this_thread::sleep_for FFA i HA 
在 指定 的 指定 时 长 内 ， 暂 停 执行 当前 线程 。 
声明 
template<typename Rep, typename Period> 


void sleep_for(std::chrono: :duration<Rep, Period> const& 
relative _time); 


在 超出 relative_ time 的 时 长 内 ， 阻 塞 当 前 线程 。 


NOTE 线程 可 能 阻塞 的 时 间 要 长 于 指定 时 长 。 如 果 可 能 ， 逝 去 的 时 间 由 将 会 由 一 个 稳定 时 钟 
决定 。 


抛 出 
无 


this_thread::sleep_until JE 7% i 4% 
暂停 指定 当前 线程 ， 直 到 到 了 指定 的 时 间 点 。 
声明 
template<typename Clock, typename Duration> 
void sleep_until( 


std::chrono: :time_point<Clock, Duration> const& 
absolute_time); 


效果 
在 到 达 absolute time 的 时 间 点 前 ， 阻 塞 当 前 线程 ， 这 个 时 间 点 由 指定 的 Clock 决 定 。 


NOTE 这 里 不 保证 会 阻塞 多 长 时 间 ， 只 有 Clock::now() 返 回 的 时 间 等 于 或 大 于 absolute time 
时 ， 阻 塞 的 线程 才能 被 解除 阻塞 。 


抛 出 
无 
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